Дневник c00l0ne

88
Статистика
Статистика
88
Статистика темы
  • Популярность
    Топ-76
  • Постов
    11,180
  • Просмотров
    1,004,281
  • Подписок
    88
  • Карма автора
    +1,027
1 557 558 559 560
  •  SnowBeaver, согласись де жа вю gpt 4 мартовская :D такая же энергетика...

    всегда когда уровень преодолевается чего-то , это чувство ...

     

    печально только что работу ты потеряешь скоро оч )

     

    Ответить Цитировать
    7707/7718
    + 0
  • техническая карточка , как модель вела себя на тестах : 

    самое интересное 

    и вот еще 

    Ответить Цитировать
    7708/7718
    + 0
  • c00l0ne @ 09.06.26  

    печально только что работу ты потеряешь скоро оч )

    да это FOMO лажа на меня не работает :) Всегда кто-то нужен будет кто реально задачи делает, а не слоп генерит. Да, конечно шлак продать дороже станет. Отваливаются клиенты, которые "в первый раз". Ещё не прошли по граблям вайбкодинга. Увы мне платят не за шутки про пизду, так бы моя жизнь конечно легче бы была... Ну и вообще, с таким инструментарием если он будет реально работать (а не как обычно) у меня вообще мало интереса делать чужие задачи (иметь работу).

    Ответить Цитировать
    118/124
    + 1
  •  SnowBeaver, тише тише

    запустил на этой сложной задаче , вообще конечно спать собирался 

    но раз такое придется сон отложить ... 

    запустил на задаче сложной ... посмотрим где упрется и насколько быстро сдается ...

    Ответить Цитировать
    7709/7718
    + 0
  •  c00l0ne, контекст всегда деградирует, да. Пока я с этим справляюсь так 

     

    - модель сделала что-то полезное, я понимаю, что оно мне ещё понадобиться

    - я прошу оформить скил и скинуть его в оглавление CLAUDE.md в проекте. 

    - у каждого проекта свой набор скилов. проект может быть тупо папка "я пишу смешные шутки" 

     

    короче, дисциплина решает.

     

    Собственно даже если у какой-то модели интеллект совсем топовый, но она не варилась в определённом классе задач, то она не даст правильного ответа. Можно например Fable любую покерную раздачу попросить разобрать. Хотя вроде как вся теория в сети общедоступна, результат всё равно будет кривой. Можешь вон с китайским попробовать. И если кто-то думает, что китайский покер сложнее среднего проекта, который 5 лысых мужиков писали 3 года, то у меня для него плохие новости :)

    Ответить Цитировать
    119/124
    + 0
  •  c00l0ne, не, не. спать надо :)

    Ответить Цитировать
    120/124
    + 0
  • SnowBeaver @ 09.06.26 

    Можешь вон с китайским попробовать

    да нормально стартера ставит уже 

    чувак это 10 ТРИЛЛИОНОВ ПАРАМЕТРОВ 

    покер для такой огромной модельки это такая мелочь

    Ответить Цитировать
    7710/7718
    + 0
  • c00l0ne @ 09.06.26  

    покер для такой огромной модельки это такая мелочь

    раз так. то он должен уверенно играть в него уметь и давать качественный разбор раздач. Пока что ни одна LLM этот фильтр не проходила. Либо бред, либо полный бред. Типа если я в дисциплине где хоть что-то понимаю получу адекватный разбор от LLM "из коробки", то это будет галочка, что оно хоть как-то думает. Сейчас как раз в таком проекте тружусь где пытаются такое построить, где LLM как клей только собирает вместе output других инструментов и большая команда каждый день парится сделать так чтобы на выходе был не бред. Это прям сильно нетривиальная задача. Но людям, кто не шарят в дисциплине всегда кажется, что ответ крутой :) увы этот баг психики LLM и взгламывает раз за разом.

    Ответить Цитировать
    121/124
    + 0
  •  SnowBeaver, gtowizard обязаны протестить Fable 5 :D 

    ждем когда они раскошелятся ... прошлые нейронки от гто 22 бб /100 лили

    пс ладно я афк

    пока кодекс работает, человек должен прилечь )

    пс Fable разошелся тут , сейчас говорит нарисуем кожаный мешочек тебе дискретных стратегий ... 

    мощно подошел ... потрошит в данный момент mip решение чтобы посмотреть что там за стратегии и как подогнать решение...

    Ответить Цитировать
    7711/7718
    + 0
  •  c00l0ne, да все обязаны кто на claude code сидит. Я вот тоже начал тестить. хотябы вместо поломанного опуса. кажется теперь cc стал чуть менее многословен, что хорошо. типа чуть лучше понимает что просишь.

    Ответить Цитировать
    122/124
    + 0
  • SnowBeaver @ 09.06.26  

    менее многословен, что хорошо. типа чуть лучше понимает что просишь

    вот глянь на LOW resoning уровень кодинга : 

     

    на low уделываеть opus 4.8 ,а gpt-5.5 вообще этот бенч провалила

    т.е. это почти нейронкой без размышлений оО

    БЕЗ РАЗМЫШЛЕНИЙ это opus 4.8 

    а с xhigh размышлениями x3

    Ответить Цитировать
    7712/7718
    + 0
  •  c00l0ne, для меня важно как раз поменьше "размышлений" и побольше соответствия спеку. И когда вот я много агентов гоняю (например для переводов видео) мне нужен sonnet, а не мощная угарная нейросетка которая может всё. Антропики это понимают, и как раз урезали именно Sonnet. выглядит так

    Вот типа сейчас я жду куллдауна подписки, но третья полосочка отвечает только за sonnet, и у меня постоянная проблема, что я его расходую, и мне потом приходится работать с опусом над задачами где он не нужен. Теперь будет ещё более мощная сетка, которая закрывает 10-20% моих запросов к такому инструменту, но не меняет моей основной части работы. Если бы у них была честная полоска с токенами, которые просто с разной скоростью сжигаются разными моделями, то я был бы им очень признателен. Но так не будет, т.к. они понимают какая модель является рабочей лошадкой. И вот как раз соннет я могу на ночь оставлять. Ей говоришь делать, она делает. Не придумывает. 

     

    Fable просто у меня заменит Opus на этапе планирования \ написания спеков. я конечно любой обнове рад, но сути работы не меняет.

    Ответить Цитировать
    123/124
    + 0
  • SnowBeaver @ 09.06.26  

    меня важно как раз поменьше "размышлений" и побольше соответствия спеку

    спека и есть как CoT ты прописываешь определенные ограничения 

    но если спеки нету , то модель сама фиксирует что будет делать , чтобы ей постоянно не перескакивать с темы на тему и для этого нужны "размышления"

    там иногда "размышления" уровня "было бы круто съесть мороженое перед тем как я напишу этот mip солвер"

    короче размышления это просто память не нужно относиться что моделька фаинтюниться от этого, она просто себя ограничивает со всех сторон уточняя цель ... 

    вот например размышления

    сразу начинает перебирать решения , видно что нулевой опыт имеется : 

    cfr с сильным дисконтированием не сработает -

    энтропийные штрафы +-

    замораживать информационные множества это оч правильный путь 

    в целом нейронка сразу понимает что влипла в тяжелый NP слой задач

    как будто чувствуется безнадежность ... 

    т.е. нейронка сразу понимает что ничего хорошего не получится и начинает рандомно стрелять 

    статья Ganzfried Sandholm оч слабая на нее опираться не имеет смысла ... 

    т.е. из всех этих размышлений полезное заморозка инфосетов , остальное ВОДА 

    которую еще предстоит доказать что это ВОДА

    а это день работы 

     

     

     

    я спеки не пишу, я действую по стратегии "подкину дров в костер"

    постоянно смещаю вектора на нужные темы и модель их разрабывает на базе обученных данных своих ... 

    когда я вижу что сместилась не туда , стараюсь обратно вернуть в нужное направление, если вижу что зациклилась на не нужном результатате смещаю в нужное русло ... 

     

    так было с gpt-5.5 pro, посмотрим как будет с Fable 5 

    кодекс пишет, fable 5 диктует , я кофе пью )

    Сообщение отредактировал c00l0ne - Вчера, 8:38
    Ответить Цитировать
    7713/7718
    + 0
  • double oracle сейчас делает : 

    крутой трюк 

    gpt-5.5 pro до этого трюка не додумался, я тем более

    Ответить Цитировать
    7714/7718
    + 0
  • c00l0ne @ 10.06.26  

    кодекс пишет, fable 5 диктует , я кофе пью )

    если результат потом устраивает заказчика, команду, работает как должно, то я только за. В моём случае так не работает. У меня сначала длинный текст разбитый по смыслу от меня, его шлифует opus (теперь наверное fable будет). Я получаю spec, вычитываю их, где-то корректирую. потом делаю срезы, которые могу проверить, прошу на них написать тесты в полуручном режиме, потом двигаюсь короткими итерациями и на каждой проверяю чего получилось. В целом это всё равно быстрее чем я с сам с нуля буду кодить, но никак не мгновенная реализация. Если в какой-то момент разжать булки и довериться AI, то просто результат не будет следовать констрейнтам, за которые мне потом заплатят. Искусство никому не нужно. Всем надо закрывать бизнесовые задачи. Без дисциплины это просто калейдоскоп слопа.

    Ответить Цитировать
    124/124
    + 0
  • тимплееров шкурю))

    чатик

     

     

     

    прикольные они , американцы, с karen играю )

    очень нужны правила 2-7 и быстрая база как играть в это чудо юдо 

    если кто-то умеет напишите в личку или сюда , просто базовые правила стартера ... а то фиши я смотрю в 2-7 много играют

     

    быстро закончились 

    пс надо будет у svolk'а посмотреть раздачи, у него учиться в 2-7 он вроде разрывает

    Сообщение отредактировал c00l0ne - Вчера, 13:23
    Ответить Цитировать
    7715/7718
    + 0
  • Чего ник спрятал?! Почему выше фишей со скринов не гоняешь, которые лучшая реклама....?

    Ответить Цитировать
    177/178
    + 0
  • CAHTEXHUK @ 10.06.26  

    Чего ник спрятал?! Почему выше фишей со скринов не гоняешь, которые лучшая реклама....?

    всмысле? я с ними за столом катал - убежали быстро , слабенькие, не выдержали напора ), да и дешево - сидят 0.25

     

    я за 1 день прошел три лимита 0.25 0.5 1 )

    +500$

     

     CAHTEXHUK, а ты чего в 2-7 и прогрессивный не играешь ? столько игры вокруг и фишей ?

    сволк скоро долларовым миллионером станет ) возможно

     CAHTEXHUK, ты не понял видимо но я выше писал что вы зря пишите starper у,  это не тимплееры , это редкостные фишары ... т.е. вы пишите старперу деду чтобы он НЕ ИГРАЛ С ФИШАМИ, якобы это тимплееры ...

     

    CAHTEXHUK @ 10.06.26 

    Чего ник спрятал

    кому он нужен

    Сообщение отредактировал c00l0ne - Вчера, 20:40
    Ответить Цитировать
    7716/7718
    + 0
  • блеат Fable 5 

    загрузил codex уже на СУТКИ , сутки работяга пашет 

    я у них еще не спрашивал чего они там добились в решении холдема , но краем глаза вижу прогресс неплохой , на терне уже что-то считают 

    дадим еще сутки и потом резюмирую 

    Fable 5 one love! must have!

    Ответить Цитировать
    7717/7718
    + 0
  •  c00l0ne, в классику играть не умею, куда в другие дисциплины лезть...

    Ответить Цитировать
    178/178
    + 0
1 557 558 559 560
2 человека читают эту тему (1 пользователь, 1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.