ахахаха
нормальные тесты такие пошли
12 млн токенов контекста :
wow
так с китайским в принципе все понятно, а что по холдему
вернемся к цепляющему за душу посту SnowBeaver
пс напишу тут небольшие тебе заметки :
рук мало имхо
по структуре бакетинг ручной ? может как-то атомарно сделать и перемешать потом через and or not xor кучку мелких атомов в более сложные структуры например: atom1 and atom2 or atom3 not atom4 (это очень глубокий уже уровень )
MLP на радостях схавает
будет очень точно
ну это не cfr конечно ...
ладно подумаю денек другой, проект у тебя оч крутой
ПТ4 лега
В принципе я понял как это работает, берутся "букеты", создаются фичи, под каждый "букет" обмазанный фичами считается предиктор ...
Ну собственно твой catboost на вход принимает бакетинг +фичи и выдает действий процент, поправь если я не прав
Пс по ощущениям это будет так себе по точности, ну если нет трилиард раздач
Надо брать модель гтошную и фаинтюнить на базу натягивать
по холдему :
новые работы
СтратФормер потом почитаю
c00l0ne,
GTOWizard vs ChatGPT
поиграли против больших LLMок своей гто нейронкой
из интересного стоимость эксперимента 5к баксов и 2000 часов времени
ну и результаты ожидаемые, блмки льют 20 бб/100 против GTO
детальная таблица:
вот еще
еще
фреймворк
и т.д. короче работ много
думаю 90 процентов занимаются фаинтюном LLMок
awakening @ 06.05.26В плане? Чтобы ллм давала покерное решение? Нет, это не сработает
Да берут llama у которой 8 миллиардов параметров для каждого спота, которая натренирована впитывать языковые конструкции, скармливают просто текстовые раздачи гтошные и она учится играть в ГТО, распределяя внутри веса так чтобы выдавать правильные стратегии
Например spingpt
если скормить ей огромную базу крепкого рега, она будет играть как крепкий рег ...
все это занимает 10 часов времени на дешевом железе :
я думаю таких ботов уже в румах просто пачками ,понятно что это 1% всего от общей поляны ... но как говориться "они есть"... сможет ли сб их обнаружить ? нет конечно, играет оно как человек в 99% потому что натренировано на человеческих раздачах ... только аудит визуальный, видеоаудит ... а это очень дорого каждого проверять по видео ...
awakening, ты сразу видно старое поколение статистов ...
ты просто представь взгляд на раздачу с учетом тонкостей 8 млрд параметров ... вот человек смотрит когда играет на раздачу, для него важны ну параметров 10-20 ну 30 у супер топ регов может 50 ... это впип оппонента , агрессия , как он видит нашу стратегию, какой борд, какая текстура, насколько хорошо понимает рег диапазоны в данной ситуации и т.д.
а ллм смотрит с точки зрения 8млрд параметров ))) обычно ограничения как у snowbeaver возникают в ручных фичах , т.е. он вручную тормозит ллм ограничивая пронстранство анализа ... но это все имхо ... просто мысли в воздух ...
но я редко ошибаюсь)
вопрос номер 1 где взять гто решение, хотя бы нейронку какую-то приближенную гонять , чтобы был baseline
awakening, вот ты говоришь как обнаружить ботов или там тимплей и прочее , у вас ОБЯЗАНА ДОЛЖНА быть нейросеть с гто решением , полным гто решением кеша ...
что делаете вы собираете статистику на БОЛЬших дистанциях , но за эту дистанцию боты выносят уже многоо , т.е. такая борьба плюсовая для ботоводов ...
а вы же должны крутить нейронку против них и AIVAT'ом резко снижать диспу и перехват у вас уже будет на первых нескольких тысячах раздач ... а за несколько тысяч раздач боты не смогут ничего выиграть ну максимум 1-2 стека ...
15 бб /100
3000 раздач 150+150+150 , 450 бб ожидания +- диспа туда сюда 200-600 , несколько стеков до перехвата
ограничить вывод до первых 10 стеков и ботов вообще не будет
все думают с развитием технологий ботов станет больше , наоборот , детект их станет проще быстрее и реги наконец-то вздохнут полной грудью
как только выйдут первые дешевые покерные llm в паблик , румы смогут детектить ботов в автоматическом режиме
Atlas от boston dynamics
опять в царапинах )
c00l0ne,
c00l0ne @ 06.05.26Пс по ощущениям это будет так себе по точности, ну если нет трилиард раздач
Надо брать модель гтошную и фаинтюнить на базу натягивать
брать ГТО-шное не надо, я уже ходил этим путём. Почти никогда реальные поля не похожи на ГТО-шные. У меня уже неплохо по точности даже на 2М рук, сейчас работаю над кластеризаций игроков и чтобы можно было смоделировать чела по небольшому объёму.
В принципе я задачу уже решил, у меня отличие любого диапазона от реального +/- 10%. Работаю над улучшением, изучаю сколько реально нужно рук для какой точности т.д. Т.е. в целом у меня уже достаточно для отсчитывания эксплойтов. Ну и надо обернуть всё в понятный сервис чтобы монетизировать. Т.е. дать людям формочку куда они кинут свою базу, потом придёт уведомление через пару суток после окончания обучения и интерфей с навигацией по дереву.
А потом пилить омаху, т.к. основной интерес именно в омахе у таких систем. Холдем уже вдоль и поперёк изучен.
Сейчас мало времени из-за переезда, потом дожму. надо арендовать несколько серверов для экспериментов. Некоторые гипотезы проверяются только вычислительным экспериментом + интуиция что гонять, а что нет. Ни у одного AI нет точного маршрута как такая задача решается оптимально. Собственно с другими сколь-нибудь стоящими задачами у него тоже самое. Когда ты пилишь что-то не слишком стандартное, то у него не на что опереться и попиздить чужой результат с гитхаба.
Чисто математически можно доказать, что даже анализ небольшой базы может давать качественный результат с низкой погрешностью. Тебе всего-лишь надо попасть во все частоты и показать то же на вскрытии, что сделало поле. Я решаю эту задачу обучая предикторы, но вообще эта задача также может сводиться к перебору с помощью генетического алгоритма. У меня не получилось, но возможно это более простой маршрут для AI. Вернее как... я просто потерял интерес жечь деньги на сервера с GA, т.к. сходимость деревьев и катбуста оказалась на практике быстрее. Последняя моя сборка вообще только на деревьях без катбуста.
вообще вся эта херабора не представляет для меня какой-то запредельной сложности по обучению и получению результата. Самое трудное это сделать такой workflow дешёвым достаточно чтобы это продавать. Ну и собственно обернуть в продукт для продажи. Тут упаковка важнее качества решения. Очень легко пожечь много ресурсов на прототип, и потом просто забыть про него. Я так десятки раз делал для разных систем.
c00l0ne @ 06.05.26Ну собственно твой catboost на вход принимает бакетинг +фичи и выдает действий процент, поправь если я не прав
Задача предиктора сказать как играть в какой-то конкретной ситуации с конкретной рукой. Т.е. предиктор не в курсе про диапазон. Задача всей модели построить взаимодействие предикторов чтобы они по итогу попали в проценты действий. Желательно в как можно большем количестве точек. И предикторы используются в цикле, который в принципе хоть и грубо, но описан в статье, которую я скинул. Есть вариации этого метода, там описан на пальцах самый простой. Какие должны быть предикторы, сколько их должно быть и т.д. так то неочевидно. Не факт, что больше значит лучше здесь. Было бы очень охуенно если бы типа трансформер сам бы выделил все значимые признаки и обучился на данных, но скорее всего это будет сильно сложнее чем то что сделал я. Для меня практический и несовершенный результат лучше идеального, на рассчёт которого у меня нет ресурсов.
И да, я не верю, что практический проверяемый результат тут можно получить в режиме вайбкода не разбираясь в методах. Иногда можно попросить AI написать точный спек системы, и с помощью другого (может быть более мощного) проанализировать с целью критики. Но разбираться всё равно самому придётся, т.к. если есть какой-то непонятный термин, то он обязательно поломает всё в какой-то момент.
SnowBeaver, все это хорошо конечно и красиво
но нужен baseline в виде gto... пока что доступных решений я не вижу ...
ни API(gtowizard только приватно дает) , ни открытой модели какой нибудь...
из решений собирать только ну это такое...
самому считать это вообще месяцы работы...
возьму еще пару дней подумать ...
что кроется вот за такими новостями :
поставил попробовал, тесты фейковые...
Зацикливается:
I l be back moment
я про недобор, а не про просадку ... и выше расчет для спинов по китайскому сделан)
короче че я объясняю , либо понял либо не понял )
катаешь всю жизнь в спины будь готов поймать недобор в 1500 баинов словить, ты можешь и вообще всю жизнь плюсовать ... без просадок , но недобор то останется ... выиграл 1 млн а должен 10 выиграть
любая игра где есть выплата в несколько сотен баинов такая будет , кому-то должно не повезти ...
выше расчет сделан с учетом структуры множителей в китайском и небольшим рейкбеком и РЕГ ПРОТИВ РЕГА