техническая карточка , как модель вела себя на тестах :
самое интересное
и вот еще
c00l0ne @ 09.06.26печально только что работу ты потеряешь скоро оч )
да это FOMO лажа на меня не работает :) Всегда кто-то нужен будет кто реально задачи делает, а не слоп генерит. Да, конечно шлак продать дороже станет. Отваливаются клиенты, которые "в первый раз". Ещё не прошли по граблям вайбкодинга. Увы мне платят не за шутки про пизду, так бы моя жизнь конечно легче бы была... Ну и вообще, с таким инструментарием если он будет реально работать (а не как обычно) у меня вообще мало интереса делать чужие задачи (иметь работу).
SnowBeaver, тише тише
запустил на этой сложной задаче , вообще конечно спать собирался
но раз такое придется сон отложить ...
запустил на задаче сложной ... посмотрим где упрется и насколько быстро сдается ...
c00l0ne, контекст всегда деградирует, да. Пока я с этим справляюсь так
- модель сделала что-то полезное, я понимаю, что оно мне ещё понадобиться
- я прошу оформить скил и скинуть его в оглавление CLAUDE.md в проекте.
- у каждого проекта свой набор скилов. проект может быть тупо папка "я пишу смешные шутки"
короче, дисциплина решает.
Собственно даже если у какой-то модели интеллект совсем топовый, но она не варилась в определённом классе задач, то она не даст правильного ответа. Можно например Fable любую покерную раздачу попросить разобрать. Хотя вроде как вся теория в сети общедоступна, результат всё равно будет кривой. Можешь вон с китайским попробовать. И если кто-то думает, что китайский покер сложнее среднего проекта, который 5 лысых мужиков писали 3 года, то у меня для него плохие новости :)
c00l0ne, не, не. спать надо :)
c00l0ne @ 09.06.26покер для такой огромной модельки это такая мелочь
раз так. то он должен уверенно играть в него уметь и давать качественный разбор раздач. Пока что ни одна LLM этот фильтр не проходила. Либо бред, либо полный бред. Типа если я в дисциплине где хоть что-то понимаю получу адекватный разбор от LLM "из коробки", то это будет галочка, что оно хоть как-то думает. Сейчас как раз в таком проекте тружусь где пытаются такое построить, где LLM как клей только собирает вместе output других инструментов и большая команда каждый день парится сделать так чтобы на выходе был не бред. Это прям сильно нетривиальная задача. Но людям, кто не шарят в дисциплине всегда кажется, что ответ крутой :) увы этот баг психики LLM и взгламывает раз за разом.
SnowBeaver, gtowizard обязаны протестить Fable 5 :D
ждем когда они раскошелятся ... прошлые нейронки от гто 22 бб /100 лили
пс ладно я афк
пока кодекс работает, человек должен прилечь )
пс Fable разошелся тут , сейчас говорит нарисуем кожаный мешочек тебе дискретных стратегий ...
мощно подошел ... потрошит в данный момент mip решение чтобы посмотреть что там за стратегии и как подогнать решение...
c00l0ne, да все обязаны кто на claude code сидит. Я вот тоже начал тестить. хотябы вместо поломанного опуса. кажется теперь cc стал чуть менее многословен, что хорошо. типа чуть лучше понимает что просишь.
c00l0ne, для меня важно как раз поменьше "размышлений" и побольше соответствия спеку. И когда вот я много агентов гоняю (например для переводов видео) мне нужен sonnet, а не мощная угарная нейросетка которая может всё. Антропики это понимают, и как раз урезали именно Sonnet. выглядит так
Вот типа сейчас я жду куллдауна подписки, но третья полосочка отвечает только за sonnet, и у меня постоянная проблема, что я его расходую, и мне потом приходится работать с опусом над задачами где он не нужен. Теперь будет ещё более мощная сетка, которая закрывает 10-20% моих запросов к такому инструменту, но не меняет моей основной части работы. Если бы у них была честная полоска с токенами, которые просто с разной скоростью сжигаются разными моделями, то я был бы им очень признателен. Но так не будет, т.к. они понимают какая модель является рабочей лошадкой. И вот как раз соннет я могу на ночь оставлять. Ей говоришь делать, она делает. Не придумывает.
Fable просто у меня заменит Opus на этапе планирования \ написания спеков. я конечно любой обнове рад, но сути работы не меняет.
SnowBeaver @ 09.06.26меня важно как раз поменьше "размышлений" и побольше соответствия спеку
спека и есть как CoT ты прописываешь определенные ограничения
но если спеки нету , то модель сама фиксирует что будет делать , чтобы ей постоянно не перескакивать с темы на тему и для этого нужны "размышления"
там иногда "размышления" уровня "было бы круто съесть мороженое перед тем как я напишу этот mip солвер"
короче размышления это просто память не нужно относиться что моделька фаинтюниться от этого, она просто себя ограничивает со всех сторон уточняя цель ...
вот например размышления
сразу начинает перебирать решения , видно что нулевой опыт имеется :
cfr с сильным дисконтированием не сработает -
энтропийные штрафы +-
замораживать информационные множества это оч правильный путь
в целом нейронка сразу понимает что влипла в тяжелый NP слой задач
как будто чувствуется безнадежность ...
т.е. нейронка сразу понимает что ничего хорошего не получится и начинает рандомно стрелять
статья Ganzfried Sandholm оч слабая на нее опираться не имеет смысла ...
т.е. из всех этих размышлений полезное заморозка инфосетов , остальное ВОДА
которую еще предстоит доказать что это ВОДА
а это день работы
я спеки не пишу, я действую по стратегии "подкину дров в костер"
постоянно смещаю вектора на нужные темы и модель их разрабывает на базе обученных данных своих ...
когда я вижу что сместилась не туда , стараюсь обратно вернуть в нужное направление, если вижу что зациклилась на не нужном результатате смещаю в нужное русло ...
так было с gpt-5.5 pro, посмотрим как будет с Fable 5
кодекс пишет, fable 5 диктует , я кофе пью )
double oracle сейчас делает :
крутой трюк
gpt-5.5 pro до этого трюка не додумался, я тем более
c00l0ne @ 10.06.26кодекс пишет, fable 5 диктует , я кофе пью )
если результат потом устраивает заказчика, команду, работает как должно, то я только за. В моём случае так не работает. У меня сначала длинный текст разбитый по смыслу от меня, его шлифует opus (теперь наверное fable будет). Я получаю spec, вычитываю их, где-то корректирую. потом делаю срезы, которые могу проверить, прошу на них написать тесты в полуручном режиме, потом двигаюсь короткими итерациями и на каждой проверяю чего получилось. В целом это всё равно быстрее чем я с сам с нуля буду кодить, но никак не мгновенная реализация. Если в какой-то момент разжать булки и довериться AI, то просто результат не будет следовать констрейнтам, за которые мне потом заплатят. Искусство никому не нужно. Всем надо закрывать бизнесовые задачи. Без дисциплины это просто калейдоскоп слопа.
тимплееров шкурю))
чатик
прикольные они , американцы, с karen играю )
очень нужны правила 2-7 и быстрая база как играть в это чудо юдо
если кто-то умеет напишите в личку или сюда , просто базовые правила стартера ... а то фиши я смотрю в 2-7 много играют
быстро закончились
пс надо будет у svolk'а посмотреть раздачи, у него учиться в 2-7 он вроде разрывает
Чего ник спрятал?! Почему выше фишей со скринов не гоняешь, которые лучшая реклама....?
CAHTEXHUK @ 10.06.26Чего ник спрятал?! Почему выше фишей со скринов не гоняешь, которые лучшая реклама....?
всмысле? я с ними за столом катал - убежали быстро , слабенькие, не выдержали напора ), да и дешево - сидят 0.25
я за 1 день прошел три лимита 0.25 0.5 1 )
+500$
CAHTEXHUK, а ты чего в 2-7 и прогрессивный не играешь ? столько игры вокруг и фишей ?
сволк скоро долларовым миллионером станет ) возможно
CAHTEXHUK, ты не понял видимо но я выше писал что вы зря пишите starper у, это не тимплееры , это редкостные фишары ... т.е. вы пишите старперу деду чтобы он НЕ ИГРАЛ С ФИШАМИ, якобы это тимплееры ...
CAHTEXHUK @ 10.06.26Чего ник спрятал
кому он нужен
блеат Fable 5
загрузил codex уже на СУТКИ , сутки работяга пашет
я у них еще не спрашивал чего они там добились в решении холдема , но краем глаза вижу прогресс неплохой , на терне уже что-то считают
дадим еще сутки и потом резюмирую
Fable 5 one love! must have!
c00l0ne, в классику играть не умею, куда в другие дисциплины лезть...
SnowBeaver, согласись де жа вю gpt 4 мартовская :D такая же энергетика...
всегда когда уровень преодолевается чего-то , это чувство ...
печально только что работу ты потеряешь скоро оч )