Форум GipsyTeam Кэш-игра Китайский покер

Дневник c00l0ne

c00l0ne

Статистика

Статистика

Статистика темы

Популярность

Топ-70
Постов

11,032
Просмотров

987,317
Подписок

88
Карма автора

+891

Лучшие посты автора

Лучшие посты читателей

ColdReader
Заходят три математика в бар. Бармен спрашивает: - Все будут пиво? Первый математик:&nbs
+25
SnowBeaver
c00l0ne, я ещё никогда так не впахивал как до развития claude code :) Появление LLM
+24
Fred
Shtirlitz, fastdecision, Feliz, вы не представляете как вам повезло что вы это только здесь читаете,
+20
larsen

+17
St_CasTieL
Мне однажды сказали примерно следующее: -Не так страшно ,когда человек творит откровенную чушь , куд
+17

По дате По рейтингу

Только автор

← 1 550 551 552

Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

5 мая, 18:43

891 13,487
11 лет на сайте

CAHTEXHUK @ 05.05.26
c00l0ne, нельзя сравнивать Спины по холдему, с китайским. У них очень разная диспа... Вон дианка что у него макс просадка 20-30би была.
я про недобор, а не про просадку ... и выше расчет для спинов по китайскому сделан)
короче че я объясняю , либо понял либо не понял )
катаешь всю жизнь в спины будь готов поймать недобор в 1500 баинов словить, ты можешь и вообще всю жизнь плюсовать ... без просадок , но недобор то останется ... выиграл 1 млн а должен 10 выиграть
любая игра где есть выплата в несколько сотен баинов такая будет , кому-то должно не повезти ...
выше расчет сделан с учетом структуры множителей в китайском и небольшим рейкбеком и РЕГ ПРОТИВ РЕГА

Ответить Цитировать

7612/7621

Ссылка скопирована

5 мая, 18:43

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

Вчера, 00:26

891 13,487
11 лет на сайте

ахахаха

нормальные тесты такие пошли

Ответить Цитировать

7613/7621

Ссылка скопирована

Вчера, 00:26

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

Вчера, 01:03

891 13,487
11 лет на сайте

12 млн токенов контекста :

wow

Ответить Цитировать

7614/7621

Ссылка скопирована

Вчера, 01:03

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

Вчера, 01:13

891 13,487
11 лет на сайте

так с китайским в принципе все понятно, а что по холдему
вернемся к цепляющему за душу посту SnowBeaver

пс напишу тут небольшие тебе заметки :
рук мало имхо
по структуре бакетинг ручной ? может как-то атомарно сделать и перемешать потом через and or not xor кучку мелких атомов в более сложные структуры например: atom1 and atom2 or atom3 not atom4 (это очень глубокий уже уровень )
MLP на радостях схавает
будет очень точно

ну это не cfr конечно ...
ладно подумаю денек другой, проект у тебя оч крутой
ПТ4 лега

В принципе я понял как это работает, берутся "букеты", создаются фичи, под каждый "букет" обмазанный фичами считается предиктор ...
Ну собственно твой catboost на вход принимает бакетинг +фичи и выдает действий процент, поправь если я не прав

Пс по ощущениям это будет так себе по точности, ну если нет трилиард раздач
Надо брать модель гтошную и фаинтюнить на базу натягивать

Сообщение отредактировал c00l0ne - Вчера, 2:04

Ответить Цитировать

7615/7621

Ссылка скопирована

Вчера, 01:13

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

Вчера, 09:18

891 13,487
11 лет на сайте

по холдему :
новые работы
СтратФормер потом почитаю

c00l0ne,
GTOWizard vs ChatGPT

поиграли против больших LLMок своей гто нейронкой
из интересного стоимость эксперимента 5к баксов и 2000 часов времени

ну и результаты ожидаемые, блмки льют 20 бб/100 против GTO

детальная таблица:

вот еще

еще

фреймворк

и т.д. короче работ много

думаю 90 процентов занимаются фаинтюном LLMок

Сообщение отредактировал c00l0ne - Вчера, 9:43

Ответить Цитировать

7616/7621

Ссылка скопирована

Вчера, 09:18

+ 0 –
Блог Профиль Личное сообщение

awakening

Вчера, 10:15

19,000 1,918
8 лет на сайте

c00l0ne @ 06.05.26
думаю 90 процентов занимаются фаинтюном LLMок
В плане? Чтобы ллм давала покерное решение? Нет, это не сработает

Ответить Цитировать

4/4

Ссылка скопирована

Вчера, 10:15

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

Вчера, 11:00

891 13,487
11 лет на сайте

awakening @ 06.05.26
В плане? Чтобы ллм давала покерное решение? Нет, это не сработает
Да берут llama у которой 8 миллиардов параметров для каждого спота, которая натренирована впитывать языковые конструкции, скармливают просто текстовые раздачи гтошные и она учится играть в ГТО, распределяя внутри веса так чтобы выдавать правильные стратегии
Например spingpt

если скормить ей огромную базу крепкого рега, она будет играть как крепкий рег ...
все это занимает 10 часов времени на дешевом железе :

я думаю таких ботов уже в румах просто пачками ,понятно что это 1% всего от общей поляны ... но как говориться "они есть"... сможет ли сб их обнаружить ? нет конечно, играет оно как человек в 99% потому что натренировано на человеческих раздачах ... только аудит визуальный, видеоаудит ... а это очень дорого каждого проверять по видео ...

awakening, ты сразу видно старое поколение статистов ...
ты просто представь взгляд на раздачу с учетом тонкостей 8 млрд параметров ... вот человек смотрит когда играет на раздачу, для него важны ну параметров 10-20 ну 30 у супер топ регов может 50 ... это впип оппонента , агрессия , как он видит нашу стратегию, какой борд, какая текстура, насколько хорошо понимает рег диапазоны в данной ситуации и т.д.

а ллм смотрит с точки зрения 8млрд параметров ))) обычно ограничения как у snowbeaver возникают в ручных фичах , т.е. он вручную тормозит ллм ограничивая пронстранство анализа ... но это все имхо ... просто мысли в воздух ...
но я редко ошибаюсь)

Сообщение отредактировал c00l0ne - Вчера, 11:10

Ответить Цитировать

7617/7621

Ссылка скопирована

Вчера, 11:00

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

Вчера, 11:12

891 13,487
11 лет на сайте

вопрос номер 1 где взять гто решение, хотя бы нейронку какую-то приближенную гонять , чтобы был baseline
awakening, вот ты говоришь как обнаружить ботов или там тимплей и прочее , у вас ОБЯЗАНА ДОЛЖНА быть нейросеть с гто решением , полным гто решением кеша ...
что делаете вы собираете статистику на БОЛЬших дистанциях , но за эту дистанцию боты выносят уже многоо , т.е. такая борьба плюсовая для ботоводов ...
а вы же должны крутить нейронку против них и AIVAT'ом резко снижать диспу и перехват у вас уже будет на первых нескольких тысячах раздач ... а за несколько тысяч раздач боты не смогут ничего выиграть ну максимум 1-2 стека ...
15 бб /100
3000 раздач 150+150+150 , 450 бб ожидания +- диспа туда сюда 200-600 , несколько стеков до перехвата
ограничить вывод до первых 10 стеков и ботов вообще не будет
все думают с развитием технологий ботов станет больше , наоборот , детект их станет проще быстрее и реги наконец-то вздохнут полной грудью
как только выйдут первые дешевые покерные llm в паблик , румы смогут детектить ботов в автоматическом режиме

Сообщение отредактировал c00l0ne - Вчера, 12:03

Ответить Цитировать

7618/7621

Ссылка скопирована

Вчера, 11:12

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

Вчера, 12:34

891 13,487
11 лет на сайте

Atlas от boston dynamics
опять в царапинах )

Ответить Цитировать

7619/7621

Ссылка скопирована

Вчера, 12:34

+ 0 –
Блог Профиль Личное сообщение

SnowBeaver

Вчера, 20:37

11,178 1,972
10 лет на сайте

c00l0ne,
c00l0ne @ 06.05.26
Пс по ощущениям это будет так себе по точности, ну если нет трилиард раздач
Надо брать модель гтошную и фаинтюнить на базу натягивать
брать ГТО-шное не надо, я уже ходил этим путём. Почти никогда реальные поля не похожи на ГТО-шные. У меня уже неплохо по точности даже на 2М рук, сейчас работаю над кластеризаций игроков и чтобы можно было смоделировать чела по небольшому объёму.

В принципе я задачу уже решил, у меня отличие любого диапазона от реального +/- 10%. Работаю над улучшением, изучаю сколько реально нужно рук для какой точности т.д. Т.е. в целом у меня уже достаточно для отсчитывания эксплойтов. Ну и надо обернуть всё в понятный сервис чтобы монетизировать. Т.е. дать людям формочку куда они кинут свою базу, потом придёт уведомление через пару суток после окончания обучения и интерфей с навигацией по дереву.

А потом пилить омаху, т.к. основной интерес именно в омахе у таких систем. Холдем уже вдоль и поперёк изучен.

Сейчас мало времени из-за переезда, потом дожму. надо арендовать несколько серверов для экспериментов. Некоторые гипотезы проверяются только вычислительным экспериментом + интуиция что гонять, а что нет. Ни у одного AI нет точного маршрута как такая задача решается оптимально. Собственно с другими сколь-нибудь стоящими задачами у него тоже самое. Когда ты пилишь что-то не слишком стандартное, то у него не на что опереться и попиздить чужой результат с гитхаба.

Чисто математически можно доказать, что даже анализ небольшой базы может давать качественный результат с низкой погрешностью. Тебе всего-лишь надо попасть во все частоты и показать то же на вскрытии, что сделало поле. Я решаю эту задачу обучая предикторы, но вообще эта задача также может сводиться к перебору с помощью генетического алгоритма. У меня не получилось, но возможно это более простой маршрут для AI. Вернее как... я просто потерял интерес жечь деньги на сервера с GA, т.к. сходимость деревьев и катбуста оказалась на практике быстрее. Последняя моя сборка вообще только на деревьях без катбуста.

вообще вся эта херабора не представляет для меня какой-то запредельной сложности по обучению и получению результата. Самое трудное это сделать такой workflow дешёвым достаточно чтобы это продавать. Ну и собственно обернуть в продукт для продажи. Тут упаковка важнее качества решения. Очень легко пожечь много ресурсов на прототип, и потом просто забыть про него. Я так десятки раз делал для разных систем.

Сообщение отредактировал SnowBeaver - Вчера, 20:52

Ответить Цитировать

87/88

Ссылка скопирована

Вчера, 20:37

+ 3 –
Блог Профиль Личное сообщение

SnowBeaver

Вчера, 21:06

11,178 1,972
10 лет на сайте

c00l0ne @ 06.05.26
Ну собственно твой catboost на вход принимает бакетинг +фичи и выдает действий процент, поправь если я не прав
Задача предиктора сказать как играть в какой-то конкретной ситуации с конкретной рукой. Т.е. предиктор не в курсе про диапазон. Задача всей модели построить взаимодействие предикторов чтобы они по итогу попали в проценты действий. Желательно в как можно большем количестве точек. И предикторы используются в цикле, который в принципе хоть и грубо, но описан в статье, которую я скинул. Есть вариации этого метода, там описан на пальцах самый простой. Какие должны быть предикторы, сколько их должно быть и т.д. так то неочевидно. Не факт, что больше значит лучше здесь. Было бы очень охуенно если бы типа трансформер сам бы выделил все значимые признаки и обучился на данных, но скорее всего это будет сильно сложнее чем то что сделал я. Для меня практический и несовершенный результат лучше идеального, на рассчёт которого у меня нет ресурсов.

И да, я не верю, что практический проверяемый результат тут можно получить в режиме вайбкода не разбираясь в методах. Иногда можно попросить AI написать точный спек системы, и с помощью другого (может быть более мощного) проанализировать с целью критики. Но разбираться всё равно самому придётся, т.к. если есть какой-то непонятный термин, то он обязательно поломает всё в какой-то момент.

Ответить Цитировать

88/88

Ссылка скопирована

Вчера, 21:06

+ 2 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

Сегодня, 12:15

891 13,487
11 лет на сайте

SnowBeaver, все это хорошо конечно и красиво
но нужен baseline в виде gto... пока что доступных решений я не вижу ...
ни API(gtowizard только приватно дает) , ни открытой модели какой нибудь...
из решений собирать только ну это такое...
самому считать это вообще месяцы работы...
возьму еще пару дней подумать ...

Ответить Цитировать

7620/7621

Ссылка скопирована

Сегодня, 12:15

+ 0 –
Автор

Блог Профиль Личное сообщение

c00l0ne

Автор

Сегодня, 12:39

891 13,487
11 лет на сайте

что кроется вот за такими новостями :

поставил попробовал, тесты фейковые...
Зацикливается:

I l be back moment

Ответить Цитировать

7621/7621

Ссылка скопирована

Сегодня, 12:39

+ 0 –

← 1 550 551 552

11032 поста

Подписаться на обновления темы по почте

1 человек читает эту тему (1 гость):

Форум GipsyTeam Кэш-игра Китайский покер

Войти или зарегистрироваться

Зачем регистрироваться на GipsyTeam?

Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
На каждой странице будет видно, где появились новые посты и комментарии.
Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.