Дневник c00l0ne (545-я страница)

По дате По рейтингу

Только автор

← 1 544 545 546 547 551 →

Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 15:38

11,166 1,970
10 лет на сайте

короче, базовая проблема с трансформером - тебе всё равно нужна будет архитектура поверх него и так же придёшь к байесовскому уточнению рано или поздно (описано в статье). У тебя 94% игроков без showdown, мы не знаем их hole cards, а именно через них передаётся информация. Интеграция unknown holes нетривиальна, но без неё пропадает 94% сигнала. Ты тупо никогда не узнаешь с чем игроки фолдят на постфлопе. Я её решил в своей архитектуре. Ну и вычислительная сложность у тебя будет значительная. У меня модель часов за 10 учится на серверном CPU. Тебе же придётся на GPU делать и сильно дольше \ дороже выйдет.

Ответить Цитировать

50/86

Ссылка скопирована

16 апреля, 15:38

+ 0 –
Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 15:39

11,166 1,970
10 лет на сайте

c00l0ne @ 16.04.26
SnowBeaver, ну такое обсуждать это бред , это плодить ботоводов ... будут мысли я напишу в лс...
все кто могли, уже наплодились. Я тебе статью скинул 2010 года. Она уже хорошо изучена и разобрана. Все у кого хватило мозгов \ мотивации это уже давно реализовали, т.к. вся инфа в паблике очень давно. А для остальных даже мой текст это непроходимый порог. Это знание само себя защищает от тиражирования :)

И да, в целом для нормальных ML инженеров данная задача является чем-то проходным. Это не обучение машин автоматическому вождению, не переводы текстов, не медицина. Это хуета собачья. Но даже с ней LLM не справится без человека со знанием предметки, мотивации и скилов специфических. Просто без шансов такую задачу решить челу, кто покер первый раз видит и не хочет разбираться. Хоть 1М$ ему дай на токены.

Ответить Цитировать

51/86

Ссылка скопирована

16 апреля, 15:39

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 16:19

819 13,467
11 лет на сайте

Мета* новую модельку кстати выпустили
*На территории РФ признана террористической и экстремистской организацией

Ответить Цитировать

7553/7601

Ссылка скопирована

16 апреля, 16:19

+ 0 –
Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 18:57

11,166 1,970
10 лет на сайте

c00l0ne @ 16.04.26
жаль дорогая силушка
кстати да, я вот сейчас напоролся. Решил научиться гонять эту про модельку. просто любопытно было альтернативное мнение на дизайн системы. Я пошёл путём MCP, т.к. основной мой инструмент claude code. Добавил Zen, скормил все документы попросил дать критический разбор. Я подумал, ну у меня там на балансе есть 5 баксов, чё я не олигарх чтоли. Должно хватить, или отрубится и 5 баксов не жалко. Но не тут оно было, встроенная логика zen при долгих ответах делает retry и в итоге сделала мне вместо одного обзора моей архитектуры аж 10 штук :) И оказывается openAI отпускает свою водку в долг. Накидал мне в итоге на -60 баксов в аккаунт. Но я изучаю фидбек теперь по 10 прогонам. Прям по классике prompt гемблинга. не зря про него писал :) Пришлось вынимать результаты моих запросов из логов на сайте. Оказывается так можно.

в целом оцениваю что оно того стоило. Не стал зажимать 60 баксов и честно погасил долг. За архитектурный разбор заплатить условно 6.5$ разово это нормально. Я б даже сказал дёшего. Качество я бы сказал там есть, но в основном обзор слишком комплиментарный. Я хотел критики, а оно 3/4 моих денег потратило чтобы рассказать какую я охуенную систему создал :) Но оставшаяся 1/4 это реально альтернативная точка зрения которая мне лично не пришла в голову пока что, и opus 4.6 тоже. Хотя она полезная и логичная.

Сообщение отредактировал SnowBeaver - 16.4.2026, 19:19

Ответить Цитировать

52/86

Ссылка скопирована

16 апреля, 18:57

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 19:37

819 13,467
11 лет на сайте

SnowBeaver @ 16.04.26
opus 4.6
Сегодня 4.7 выпустили
Скоро mythos выпустят в паблик, будет разьеп

Ответить Цитировать

7554/7601

Ссылка скопирована

16 апреля, 19:37

+ 0 –
Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 19:39

11,166 1,970
10 лет на сайте

c00l0ne @ 16.04.26
Сегодня 4.7 выпустили
Скоро mythos выпустят в паблик, будет разьеп
просто опус я даром получаю (по подписке), а за жэпэтэ сам плачу. если работать в рамках подхода как в доке от моего коллеги, то переход между версиями не меняет сильно стиль работы. делаешь то же самое.

Ответить Цитировать

53/86

Ссылка скопирована

16 апреля, 19:39

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 19:45

819 13,467
11 лет на сайте

SnowBeaver, ладно я бухать, скучное это integer программирование нахрен))) float32 и float64 тоже... Через пару лет угарать все будем над тем чем занимались.... Пропустили бы пару лет своей жизни?)
А во имя прогресса?)

SnowBeaver, опус скатился, я недавно два часа ему объяснял элементарное, сдался , оставил агента в виде gpt 5.4 который жёстко опуса обучал)

Но их можно понять все мощностя на mythos, у тебя кстати нет знакомых кто юзал? Из корпораций? Какого оно?

Ответить Цитировать

7555/7601

Ссылка скопирована

16 апреля, 19:45

+ 1 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 19:55

819 13,467
11 лет на сайте

SnowBeaver, о кстати видел уже тесты gpt vs wizard?
На arxiv есть
Gtowizard выложили , llm 20 bb льют
Я думаю через пару лет максимум 5 бб будет

А тебе я желаю копать в сторону трансформеров, ты всегда на шаг от технологической волны двигаешься
Набери spingpt, тебе надо просто создать свою cashgpt...

Ответить Цитировать

7556/7601

Ссылка скопирована

16 апреля, 19:55

+ 0 –
Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 20:03

11,166 1,970
10 лет на сайте

c00l0ne @ 16.04.26
SnowBeaver, о кстати видел уже тесты gpt vs wizard?
На arxiv есть
Gtowizard выложили , llm 20 bb льют
Я думаю через пару лет максимум 5 бб будет
я уже не берусь прогнозировать что будет через пару лет :) Но если смотреть теорию, то GTO в приципе не может быть впитано полностью с помощью любых лингвистических правил. Его невозможно объяснить, можно только находить разной точности паттерны. Так что единственный способ его побить это отсчитать GTO точнее. С меньшим шагом сайзов, с более сложным деревом и т.д. На практике это означает, что даже если визард будет бить LLM с 5бб на 100, люди всё равно не смогут научиться такому уровню игры и будут сосаки с куда более разгромным счётом.

Ответить Цитировать

54/86

Ссылка скопирована

16 апреля, 20:03

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 20:05

819 13,467
11 лет на сайте

SnowBeaver, ну ты не захочешь оказаться за столом с пятью gpt 10)))

Покеру все - уже не много осталось... Слишком порог входа снизился...

Я скоро универсальный алгоритм может выложу решения любой игры с любым числом состояний с неполной информацией, на базе тренировки трансформеров, но если все получится , пока только планы наполеоновские, но свет в конце туннеля уже виден

Будем в оффлайне значит рубиться

Сообщение отредактировал c00l0ne - 16.4.2026, 20:16

Ответить Цитировать

7557/7601

Ссылка скопирована

16 апреля, 20:05

+ 0 –
Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 20:19

11,166 1,970
10 лет на сайте

c00l0ne @ 16.04.26
SnowBeaver, ну ты не захочешь оказаться за столом с пятью gpt 10)))
да я и с живыми людьми не хочу :) я вообще не люблю играть сам
Покеру все - уже не много осталось... Слишком порог входа снизился...
Чисто технически покерные боты разрывают поляну и топовых регов уже лет 10 не оставляя шансов. Типа ничего не изменилось. Ну, подсказчики стали доступнее. С этим и надо бороться. С точки зрения что люди в массе типа обучатся лучше играть ... пффф. я в это не верю :) люди необучаемые свиньи.

То что в каком-то руме технически возможно добавлять ботов и играть с RTA чисто выбор рума. На практике технологии позволяют пресечь это полностью. Но меры контроля также ухудшают экспириент рекреационных игроков. Вот румы и балансируют. т.к. у тебя есть в проверке гипотез два типа ошибок - первого рода и второго. первого рода это когда ложная тревога, а второго рода это мы пропустили читера. И вот сейчас ложная тревога чувствительнее для профита рума. А между двумя этими ошибками всегда компромисс. Могу ошибаться, это тема awakening

Ответить Цитировать

55/86

Ссылка скопирована

16 апреля, 20:19

+ 1 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 20:23

819 13,467
11 лет на сайте

SnowBeaver, а что есть доступное обучение? Ты странно рассуждаешь, ок я сейчас проиграл раздачу , куда мне идти разбирать?
Я иду в gpt-5.4 и он порет чушь абсолютно пофиг ему на покер... Покупать подписку чтобы глянуть гто ?) для чего ? Поляна играет по другому, идти к тебе за пару тысяч долларов майнинг глянуть? Дорого, а вот если gpt 10 объяснит как эксплойтить руку и правильно делать ставки ... Это а) недорого б) они независимо зарабатывают , у них нет предвзятости как у ГТО или майнеров и т.д.
Честно ребятам кто крутит ИИ сейчас невероятно повезло ... Самые везучие черти)
Но им еще надо довести дело до конца ... Очень много сфер ИИшкой не покрыто ...

Сообщение отредактировал c00l0ne - 16.4.2026, 20:38

Ответить Цитировать

7558/7601

Ссылка скопирована

16 апреля, 20:23

+ 0 –
Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 20:42

11,166 1,970
10 лет на сайте

c00l0ne @ 16.04.26
Ты странно рассуждаешь, ок я сейчас проиграл раздачу , куда мне идти разбирать?
вообще не к LLM :) т.к. оно резалт ориентед. попробуй какую-нибудь раздачу разобрать из категории - я поставил, оп сбросился на блеф, и ту же отредактировать где ты поставил, оп тебя вскрыл по более сильной карте. Главное не в одном контекстном окне. Тебе LLM скажет что по первой ты молодец, а по второй - не надо было блефовать. У LLM нет доступа к GTO данным.

В итоге если ты будешь каждый раз проигранные раздачи разбирать с помощью AI, то ты точно не улучшишь свою игру никогда. Повезло нормальным регам с нормальным обучением, т.к. остальные будут дрочить в холостую и не усилят свою игру.

Вообще ходить по любому вопрос к LLM это долбоебизм, который имеет последствия. У тебя 99% интернета даже на покерных форумах не умеют играть в покер. Ты просто идёшь за такой вот усреднённой рекомендацией. LLM выдаёт тебе максимально правдоподобный результат, а не максимально корректный. Для покера это фатальный лик.

ну и да, обучение покеру и не должно быть доступным :) с какого хуя? Пусть дрочат свои визарды и LLM. Это безобидно и приятно. А прошаренные парни будут продолжать зарабатывать. Чем больше людей уходят за виртуальным счастьем, тем больше остаётся пространства людям, которые добиваются реальных ценностей в этой жизни.

Ответить Цитировать

56/86

Ссылка скопирована

16 апреля, 20:42

+ 1 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 20:49

819 13,467
11 лет на сайте

SnowBeaver, блин ну это надо за столиком обсуждать Лан забей...я катать пошел, Фиши сами себя не разорят
Хз ты на форуме топ1 собеседник

SnowBeaver @ 16.04.26
LLM нет доступа к GTO данным.
Это не сложно организовать кстати mcp rag
Но это не то, надо чтобы в обучение попало ГТО покерные, а это стоит денег миллионов пять долларов +-

Ответить Цитировать

7559/7601

Ссылка скопирована

16 апреля, 20:49

+ 1 –
Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 20:57

11,166 1,970
10 лет на сайте

c00l0ne @ 16.04.26
Это не сложно организовать кстати mcp rag
Но это не то, надо чтобы в обучение попало ГТО покерные, а это стоит денег миллионов пять долларов +-
я не верю в обучение покеру с помощью LLM даже если туда польностью имплементированы GTO данные. Это всё ещё остаётся дрочкой.

Единственный путь тащить в покер это изучать историю реальных игр. GTO как основа обучения это морок. наебалово.

Ответить Цитировать

57/86

Ссылка скопирована

16 апреля, 20:57

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 21:04

819 13,467
11 лет на сайте

SnowBeaver, да не, солвер основа основ

Ответить Цитировать

7560/7601

Ссылка скопирована

16 апреля, 21:04

+ 0 –
Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 21:05

11,166 1,970
10 лет на сайте

c00l0ne @ 16.04.26
SnowBeaver, да не, солвер основа основ
GTO != solver.

Люди кто могут нормально применять инструменты зарабатывают. Кто не могут и не понимают что и зачем нужно спонсируют тех кто может.

Ответить Цитировать

58/86

Ссылка скопирована

16 апреля, 21:05

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 21:06

819 13,467
11 лет на сайте

SnowBeaver @ 16.04.26
GTO != solver.
Это правда
Нужен HTO
Human optimal play

Ответить Цитировать

7561/7601

Ссылка скопирована

16 апреля, 21:06

+ 0 –
Блог Профиль Личное сообщение

SnowBeaver

16 апреля, 21:13

11,166 1,970
10 лет на сайте

c00l0ne @ 16.04.26
Это правда
Нужен HTO
Human optimal play
сейчас все массово используют термин GTO когда говорят о равновесной стратегии (equilibrium). А на самом деле GTO это теоретически оптимальная стратегия в момент когда ты учёл все вводные. Ну т.е. делаешь наилучшее решение доступное в теории на основе всех данных которые у тебя есть. Сказать, что сыграно по GTO, или я играю по GTO здесь предельно неграмотно. Но общепринято :) думаю если спросишь любую LLM, то она будет против меня. Поэтому и покеру они никогда не научат.

Ответить Цитировать

59/86

Ссылка скопирована

16 апреля, 21:13

+ 1 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

16 апреля, 21:29

819 13,467
11 лет на сайте

Gto = nash
Exploit = max
Avg = hto(то что делаешь ты)

Ответить Цитировать

7562/7601

Ссылка скопирована

16 апреля, 21:29

+ 0 –

← 1 544 545 546 547 551 →

11003 поста

Подписаться на обновления темы по почте

3 человека читают эту тему (1 пользователь, 2 гостя):

c00l0ne

Форум GipsyTeam Кэш-игра Китайский покер

Войти или зарегистрироваться

Зачем регистрироваться на GipsyTeam?

Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
На каждой странице будет видно, где появились новые посты и комментарии.
Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.