c00l0ne @ 16.04.26SnowBeaver, ну такое обсуждать это бред , это плодить ботоводов ... будут мысли я напишу в лс...
все кто могли, уже наплодились. Я тебе статью скинул 2010 года. Она уже хорошо изучена и разобрана. Все у кого хватило мозгов \ мотивации это уже давно реализовали, т.к. вся инфа в паблике очень давно. А для остальных даже мой текст это непроходимый порог. Это знание само себя защищает от тиражирования :)
И да, в целом для нормальных ML инженеров данная задача является чем-то проходным. Это не обучение машин автоматическому вождению, не переводы текстов, не медицина. Это хуета собачья. Но даже с ней LLM не справится без человека со знанием предметки, мотивации и скилов специфических. Просто без шансов такую задачу решить челу, кто покер первый раз видит и не хочет разбираться. Хоть 1М$ ему дай на токены.
Мета* новую модельку кстати выпустили
*На территории РФ признана террористической и экстремистской организацией
c00l0ne @ 16.04.26жаль дорогая силушка
кстати да, я вот сейчас напоролся. Решил научиться гонять эту про модельку. просто любопытно было альтернативное мнение на дизайн системы. Я пошёл путём MCP, т.к. основной мой инструмент claude code. Добавил Zen, скормил все документы попросил дать критический разбор. Я подумал, ну у меня там на балансе есть 5 баксов, чё я не олигарх чтоли. Должно хватить, или отрубится и 5 баксов не жалко. Но не тут оно было, встроенная логика zen при долгих ответах делает retry и в итоге сделала мне вместо одного обзора моей архитектуры аж 10 штук :) И оказывается openAI отпускает свою водку в долг. Накидал мне в итоге на -60 баксов в аккаунт. Но я изучаю фидбек теперь по 10 прогонам. Прям по классике prompt гемблинга. не зря про него писал :) Пришлось вынимать результаты моих запросов из логов на сайте. Оказывается так можно.
в целом оцениваю что оно того стоило. Не стал зажимать 60 баксов и честно погасил долг. За архитектурный разбор заплатить условно 6.5$ разово это нормально. Я б даже сказал дёшего. Качество я бы сказал там есть, но в основном обзор слишком комплиментарный. Я хотел критики, а оно 3/4 моих денег потратило чтобы рассказать какую я охуенную систему создал :) Но оставшаяся 1/4 это реально альтернативная точка зрения которая мне лично не пришла в голову пока что, и opus 4.6 тоже. Хотя она полезная и логичная.
SnowBeaver, ладно я бухать, скучное это integer программирование нахрен))) float32 и float64 тоже... Через пару лет угарать все будем над тем чем занимались.... Пропустили бы пару лет своей жизни?)
А во имя прогресса?)
SnowBeaver, опус скатился, я недавно два часа ему объяснял элементарное, сдался , оставил агента в виде gpt 5.4 который жёстко опуса обучал)
Но их можно понять все мощностя на mythos, у тебя кстати нет знакомых кто юзал? Из корпораций? Какого оно?
SnowBeaver, о кстати видел уже тесты gpt vs wizard?
На arxiv есть
Gtowizard выложили , llm 20 bb льют
Я думаю через пару лет максимум 5 бб будет
А тебе я желаю копать в сторону трансформеров, ты всегда на шаг от технологической волны двигаешься
Набери spingpt, тебе надо просто создать свою cashgpt...
c00l0ne @ 16.04.26SnowBeaver, о кстати видел уже тесты gpt vs wizard?
На arxiv есть
Gtowizard выложили , llm 20 bb льют
Я думаю через пару лет максимум 5 бб будет
я уже не берусь прогнозировать что будет через пару лет :) Но если смотреть теорию, то GTO в приципе не может быть впитано полностью с помощью любых лингвистических правил. Его невозможно объяснить, можно только находить разной точности паттерны. Так что единственный способ его побить это отсчитать GTO точнее. С меньшим шагом сайзов, с более сложным деревом и т.д. На практике это означает, что даже если визард будет бить LLM с 5бб на 100, люди всё равно не смогут научиться такому уровню игры и будут сосаки с куда более разгромным счётом.
SnowBeaver, ну ты не захочешь оказаться за столом с пятью gpt 10)))
Покеру все - уже не много осталось... Слишком порог входа снизился...
Я скоро универсальный алгоритм может выложу решения любой игры с любым числом состояний с неполной информацией, на базе тренировки трансформеров, но если все получится , пока только планы наполеоновские, но свет в конце туннеля уже виден
Будем в оффлайне значит рубиться
c00l0ne @ 16.04.26SnowBeaver, ну ты не захочешь оказаться за столом с пятью gpt 10)))
да я и с живыми людьми не хочу :) я вообще не люблю играть сам
Покеру все - уже не много осталось... Слишком порог входа снизился...
Чисто технически покерные боты разрывают поляну и топовых регов уже лет 10 не оставляя шансов. Типа ничего не изменилось. Ну, подсказчики стали доступнее. С этим и надо бороться. С точки зрения что люди в массе типа обучатся лучше играть ... пффф. я в это не верю :) люди необучаемые свиньи.
То что в каком-то руме технически возможно добавлять ботов и играть с RTA чисто выбор рума. На практике технологии позволяют пресечь это полностью. Но меры контроля также ухудшают экспириент рекреационных игроков. Вот румы и балансируют. т.к. у тебя есть в проверке гипотез два типа ошибок - первого рода и второго. первого рода это когда ложная тревога, а второго рода это мы пропустили читера. И вот сейчас ложная тревога чувствительнее для профита рума. А между двумя этими ошибками всегда компромисс. Могу ошибаться, это тема awakening
SnowBeaver, а что есть доступное обучение? Ты странно рассуждаешь, ок я сейчас проиграл раздачу , куда мне идти разбирать?
Я иду в gpt-5.4 и он порет чушь абсолютно пофиг ему на покер... Покупать подписку чтобы глянуть гто ?) для чего ? Поляна играет по другому, идти к тебе за пару тысяч долларов майнинг глянуть? Дорого, а вот если gpt 10 объяснит как эксплойтить руку и правильно делать ставки ... Это а) недорого б) они независимо зарабатывают , у них нет предвзятости как у ГТО или майнеров и т.д.
Честно ребятам кто крутит ИИ сейчас невероятно повезло ... Самые везучие черти)
Но им еще надо довести дело до конца ... Очень много сфер ИИшкой не покрыто ...
c00l0ne @ 16.04.26Ты странно рассуждаешь, ок я сейчас проиграл раздачу , куда мне идти разбирать?
вообще не к LLM :) т.к. оно резалт ориентед. попробуй какую-нибудь раздачу разобрать из категории - я поставил, оп сбросился на блеф, и ту же отредактировать где ты поставил, оп тебя вскрыл по более сильной карте. Главное не в одном контекстном окне. Тебе LLM скажет что по первой ты молодец, а по второй - не надо было блефовать. У LLM нет доступа к GTO данным.
В итоге если ты будешь каждый раз проигранные раздачи разбирать с помощью AI, то ты точно не улучшишь свою игру никогда. Повезло нормальным регам с нормальным обучением, т.к. остальные будут дрочить в холостую и не усилят свою игру.
Вообще ходить по любому вопрос к LLM это долбоебизм, который имеет последствия. У тебя 99% интернета даже на покерных форумах не умеют играть в покер. Ты просто идёшь за такой вот усреднённой рекомендацией. LLM выдаёт тебе максимально правдоподобный результат, а не максимально корректный. Для покера это фатальный лик.
ну и да, обучение покеру и не должно быть доступным :) с какого хуя? Пусть дрочат свои визарды и LLM. Это безобидно и приятно. А прошаренные парни будут продолжать зарабатывать. Чем больше людей уходят за виртуальным счастьем, тем больше остаётся пространства людям, которые добиваются реальных ценностей в этой жизни.
SnowBeaver, блин ну это надо за столиком обсуждать Лан забей...я катать пошел, Фиши сами себя не разорят
Хз ты на форуме топ1 собеседник
SnowBeaver @ 16.04.26LLM нет доступа к GTO данным.
Это не сложно организовать кстати mcp rag
Но это не то, надо чтобы в обучение попало ГТО покерные, а это стоит денег миллионов пять долларов +-
c00l0ne @ 16.04.26Это не сложно организовать кстати mcp rag
Но это не то, надо чтобы в обучение попало ГТО покерные, а это стоит денег миллионов пять долларов +-
я не верю в обучение покеру с помощью LLM даже если туда польностью имплементированы GTO данные. Это всё ещё остаётся дрочкой.
Единственный путь тащить в покер это изучать историю реальных игр. GTO как основа обучения это морок. наебалово.
SnowBeaver, да не, солвер основа основ
c00l0ne @ 16.04.26Это правда
Нужен HTO
Human optimal play
сейчас все массово используют термин GTO когда говорят о равновесной стратегии (equilibrium). А на самом деле GTO это теоретически оптимальная стратегия в момент когда ты учёл все вводные. Ну т.е. делаешь наилучшее решение доступное в теории на основе всех данных которые у тебя есть. Сказать, что сыграно по GTO, или я играю по GTO здесь предельно неграмотно. Но общепринято :) думаю если спросишь любую LLM, то она будет против меня. Поэтому и покеру они никогда не научат.
Gto = nash
Exploit = max
Avg = hto(то что делаешь ты)
короче, базовая проблема с трансформером - тебе всё равно нужна будет архитектура поверх него и так же придёшь к байесовскому уточнению рано или поздно (описано в статье). У тебя 94% игроков без showdown, мы не знаем их hole cards, а именно через них передаётся информация. Интеграция unknown holes нетривиальна, но без неё пропадает 94% сигнала. Ты тупо никогда не узнаешь с чем игроки фолдят на постфлопе. Я её решил в своей архитектуре. Ну и вычислительная сложность у тебя будет значительная. У меня модель часов за 10 учится на серверном CPU. Тебе же придётся на GPU делать и сильно дольше \ дороже выйдет.