CashTaker, как и в любой устоявшейся человеческой деятельности в покере возник свой слэнг, который не полностью совпадает с теорией игр, да и вообще математикой. Мы также например часто говорим "это диспа", но под этим может иметься целый спектр разных утверждений. Но тоже самое есть у кого угодно ещё. Медиков, нефтянников, работников ритуальных услуг. Это правда не важно. Но когда кто-то переходит из игрока\тренера в категорию аналитиков, то там уже можно и спросить с человека что он имел в виду и чем именно отличается.
нет прощения железному болванчегу как думаете ?
кринж такой
пробую переключиться на gemini 3.1 pro ... тяжело идет ...
SnowBeaver, CashTaker, гто шмотэо какая разница все понимают что это посчитанное солвером решение оптимальное ... а вы говорите с уклоном на максэксплойт ... nash это вообще раньше таблички пуш фолда были)
отсюда "пушить по нешу" до сих пор их помню ...
тут я за нейронки что они терминов лишних не придумают, уже все вшито ... люди много литературного выдают ... мало алгоритмически ценного ... а про точные числа вообще промолчу)
пс обещал алгоритм всея всего решателя :
на примере шахмат возьмем
берем точную информацию а это финальные терминальные доски : белые ставят мат, ничья, черные ставят мат
обучаем их классифицировать трансформером (как найти эти все терминальные доски думаю не надо объяснять )
далее делаем -1 ход назад (желательно адекватным солвером , чтобы широко не ходить влево) , n-1 ход тоже обучаем уже новым трансформером , и так n-2 n-3 n-4 n-5 и получаем сотню добрую трансформеров до стартовой позиции ... теперь ходим ими и вот вам Лила на максималках )
кто это провернет обязательно чиркните в личку
проблема такого солвера что он только на хорошем обучен , дальше небольшой фаинтюн и калибровка
alphazero будет нервно курить в сторонке) имхо )
и обучается на обычном потребительском железе , но лучше конечно h100
Gemini 3.1 pro еще кринжа
до minimax m2.7 ему еще расти и Рости
"Один раз - это случайность. Два раза - совпадение. Три раза - враг под столом." (с) MiniMax M2.7
ахаххаха "про гугл и его баги"
как же они радуются костылю этому , плакать надо
c00l0ne @ 19.04.26SnowBeaver, CashTaker, гто шмотэо какая разница все понимают что это посчитанное солвером решение оптимальное ... а вы говорите с уклоном на максэксплойт ... nash это вообще раньше таблички пуш фолда были)
то что считает солвер может быть оптимальным, а может быть и просто неверным решением. Почему это так бывает приходится объяснять с точки зрения разбора метода и объяснение что чем является, а что нет. Увы, люди способные это понять даже при объяснении без математики на пальцах размазаны в покерном мире тонким слоем.
SnowBeaver, сложно понять про что ты пишешь, есть солвер gto , он считает не гто типо ? CFR алгоритм ?)
или про что ты ?
про максэксплойт стратегию ?
разделите пожалуйста мух от котлет
CashTaker, ты про максэксплойт и ты про макс эксплойт SnowBeaver, ?
причем тут тогда GTO
гто считается на CFR солверах
максэксплойт считается: садишь 4 бота с шарингом и одного фиша и себя
и считаешь как ты в -10бб на сто уезжаешь на любой стратегии)
из последних достижений ребята из GTOWizard сделали нейросеть которая любой спот любой игры в холдем считает за несколько секунд до десятых процента , про это есть статья на arxiv ...
выдал базу все что знаю ...
c00l0ne @ 19.04.26SnowBeaver, сложно понять про что ты пишешь, есть солвер gto , он считает не гто типо ? CFR алгоритм ?)
или про что ты ?
про максэксплойт стратегию ?
разделите пожалуйста мух от котлет
смотри, отделяю. Солвер означает решатель. Не обязательно GTO, оно решает то что должно решать по своему заложенному алгоритму.
Если солвер реализует CFR алгоритм, то значит он "минимизирует regrets". Regret это то, сколько игрок потерял сыграв по какой-то стратегии по сравнению с максимально прибыльной (в рамках заданной модели, а не вообще). Далее все пошли во что гораздо допиливать этот алгоритм. Но смысл остаётся тем же - мы заменили реальную игру на некоторую модель, которая доказанно может сходиться к какому-то своему стабильному состоянию. В покере это стабильное состояние называют GTO. На практике чтобы CFR реализовал идеальную модель в покере алгоритму нужны огромные вычислительные ресурсы и память, которых ни у кого нет. В математике говорят что мы достигли ε-Nash Equilibrium с каким-то уровнем exploitability. То что сделал GTOWizard на нейросетях (не они первые, просто в паблике не светилось) это реализовали аппроксимацию regrets с помощью NN, которые вобщем-то для аппроксимации функций и хороши. Ничего фундаментально нового они не открыли и не дали пользователям сверх того, что они и так могли сами посчитать в солвере. Они просто оптимизировали свои вычислительные ресурсы чтобы считать тоже самое быстрее. Тем самым срезали свои косты. Чем это полезно пользователям? имхо пользователям должно быть похер как реализован алгоритм если он реализован корректно. Никакого вау эффектна для меня. Бахваляться точностью тоже смешно, т.к. в практическом плане стратегии от увеличения точности не становятся лучше для человека, который им хочет научиться. Даже какой-то примитивный показатель типа 0.1 bb/100 является избыточным для того чтобы понять как играть.
GTO - это покерный жаргон, который не используется в теории игр. Также как в математике нет такого понятия как "диспа". Но максимально близко это можно описать как рассчитанное при заданных условиях равновесие Нэша по какой-то модели. Любая модель будет приблизительной, и какая-то больше, какая-то меньше. Можно получить такое же решение (GTO) без солвера. Т.е. есть другие модели поиска равновесных стратегий. Poker snowie например реализовывал reinforcement learning. Это не CFR, но тоже может приходить к такому же равновесию (а может не приходить, или приходить к другому, но тоже очень отбаллансированному, которое никто из живых игроков не сможет эксплуатировать).
Проблема CFR и её реализаций в том, что далеко не все разумные параметры влияющие на равновесие обычно учтены. И у любого солвера есть определённые проблемы с этим. Но при этом когда ты говоришь, что какое-то GTO из конкретного солвера вполне себе эксплуатируемо это вызывает непонимание. Типа как может быть general theoretic optimal эксплуатируемо? Это же невозможно бля, тот кто этот пишет дурак, и вообще с солверами не работал. Т.к. на какой-то момент покер перестал развиваться, прошёл свой апекс и теперь идёт в деградацию, то очень мало ресурсов инвестируется в создание качественно новых солверов. Повторюсь, GTOWizard не сделал качественно новое решение, а только локальную оптимизацию вычислительных ресурсов (заработав на срезанных костах).
Как можно понять что GTO не GTO и проделать вычислительный эксперимент, который эксплуатирует piosolver решения с помощью jesolver я уже писал в своём блоге. Всем было пофиг тогда, думаю повторяться нет смысла. Можно выжать из любого решения дополнительный прирост EV даже не усложняя дерево. Делается это просто и без увеличения "точности", которая на самом деле в солвере точностью не является. Когда ты пишешь "до десятых процента", то надо понимать от чего ты их берёшь эти проценты. А берёшь ты их от изменения EV на какой-то итерации (или от изменения стратегии, что не суть). Т.е. у тебя стратегия стабилизировалась в рамках заданных условий. Это не точность. Т.к. чтобы была точность, то должен быть модельный объект с которым сравнивают. Monkersolver хотябы честно пишут volatility и iteration per node. Это честные понятия. "Точность" - маркетинг. Собственно когда считаешь сам в pio, то там пишут exploitability. Но это тоже параметр для ознакомления, а не что-то реализуемое в реальной игре, которую модель покрывает очень с большой погрешностью.
Резюмирую:
GTO это всегда то, что в голове у применяющего данный термин. Такой же бессмысленный для оперирования как "диспа" или ГСЧ. Для большинства это значит, что если он построил в каком-то солвере стратегию без локов, то это GTO. Всё, никакого другого смысла нет. А если уж вдруг поставил пару локов, то это эксплойт.
Кто первый придумал термин я х.з. если честно. Но наверняка кто-то из великих покерных математиков, которые бы в провинциальный тех вуз экзамен не сдали. Оно звучит наукоподобно, поэтому всем зашло. Хочется же заниматься чем-то серьёзным, а не просто в картишки отжимать деньги у людей с проблемами психики.
c00l0ne @ 19.04.26садишь 4 бота с шарингом и одного фиша и себя
и считаешь как ты в -10бб на сто уезжаешь на любой стратегии)
Если против тебя играют боты с шарингом, то ты не обязательно улетаешь в минус (но как правило). Но гарантированно твоя жёлтая никогда не будет догонять зелёную на любой длительной дистанции. Т.е. дистанция не вернёт никогда даже правнукам, т.к. ты и боты играете разную игру с точки зрения модели. И когда какой-то рум изучается на предмет что там с недобором у регов, то если там в среднем недобор стабильный (не в рамках статистической погрешности), то этот рум заболочен ботами с шарингом. Изучается даже на небольшом майнинге (ляма 2-3 рук достаточно). Т.е. тебя не обыграли, а наебали :)
я коротко напишу, все что я пишу - это "по чуйке", чтобы более детально - надо в теорию/математику нырять. солвер = решатель, вопрос в том что он решает. и насколько модель на которую натравили солвер близка к оптимуму. я сейчас про шахматы пример приведу
вот были шахматы. сперва программы по ним были слабые. Каспаров их вертел на причинном месте. потом они стали получше. но Крамник мог против них стоять. эти про били в слабые места моделей.
потом программы стали лучше. а потом пришли нейронки, там скорее всего нейронки + что было и так по моделям, но я все что пишу - это "по чуйке". я себя даже не проверяю, но суть я передаю, я думаю.
так вот, пришли нейронки, модель стала лучше (хоть и другой). итог: если у тебя не прям высокий уровень - тебя Лила натренерованная на игру против форы дубинкой и без ферзя побьет по голове. без ладьи там вообще ад.
и эти аналогии можно на солверы по покеру натянуть.
SnowBeaver, много букоф, думаю лучше длиннопосты в своем дневнике писать)
SnowBeaver @ 19.04.26покерные солверы не эволюционируют. вообще :) всё что сделано, сделано уже очень давно. Даже те, что были вроде хорошие, уже невозможно купить в паблике.
Ты не следишь за новинками может быть, нейронками решили холдем я же выше писал, за 6 сек ГТО решение.... Это не эволюция? Давайте ка каждое предположение проверять поиском, а cfr солвеам эволюционировать некуда, там все в идеал сделано и никто никогда не обыграет эту стратегию прочитанную через cfr , CashTaker, ты говоришь про эволюцию вычислений, bruteforce сменяется невероятно точными приближениями, которые позволяют глубже и глубже считать
Все ребята духоту тут надо проветривать от солверов...
Дальше только про иишку
вот вам про piosolver :
и никто из людей никогда не сможет победить стратегию HU piosolvera да хотя бы в 2 сайзинга ... 33% и 75%
посчитанную с точностью 5bb/100
вообще рекомендую такой подход , берете свои сообщения и информацию оборачиваете в функцию полезности/время
Q ( text) =
и если чувствуете что ценность не так высока, а букоф много ,стоит может через иишку хотя бы прогнать :
SnowBeaver,
честно для меня тут 0 свежей информации
ну типо вода водой
ну cfr считает гто приближенное дальше что , гто это типо оптимальное решение выше человека которое идет все называют , гто визарт это
МЕГА ПРОРЫВ ТЫ ЧЕГО ? нейронкой за несколько секунд посчитать ГТО решение которое часами считали ранее ? бл если это не прорыв я хз что для тебя прорыв ....
ну то что пиосолвер всего не учитывает это понятно, но он абсолютно честно гоняет руки и все ок внутри , мало кто лучше сделает , а есть ли смысл вообще лучше делать то ?
ради 0.01% пота переписать солвер?
вот про GTO
ты в целом все круто написал но так много букоф, это же время надо читать это все ... я хорошо через ии прогоняю 99% текстов ... а представь кто-то читает время тратит разбирается в чем там суть ...
у gemini 3.1 pro есть дешевая штука называется cache write 0.35$ / 1 миллион токенов
кто хочет обработать гигантские объемы информации , рекомендую
засовываете в системный промпт свой огромный текст , ставите кеш после системного промпта у кого ручное кеширование, пишите сообщение и обработка идет так :
сначала промпт кешируется за 0.35$, а потом тут же читается из кеша и стоимость 1 млн идет 0.5$
итог обработать 100 млн токенов будет стоить 50$ :D
1млрд 500$
я за пол года последние сжег вот столько :
c00l0ne @ 20.04.26ты в целом все круто написал но так много букоф, это же время надо читать это все ... я хорошо через ии прогоняю 99% текстов ... а представь кто-то читает время тратит разбирается в чем там суть ...
Я очень коротко описал :) AI пофиг на смыслы, поэтому оно может урезать что угодно. Можно пытаться урезать всё с помощью AI пока у тебя от всего текста не останется буква Ю (или другая).
Если ты будешь любой текст длинее 50 символов пытаться себе "объяснить" с помощью AI таким образом, то через какое-то время в магазин за картошкой без AI сходить не сможешь (и тексты в итоге не поймёшь).
Kyka @ 20.04.26Дисперсия - это конкретный математический термин с конкретной формулой. Или ты имеешь ввиду именно сокращение "диспа"?
я как-то хотел в своём блоге сделать подробный разбор термина. Если тут начну, то c00l0ne опять скажет, что я задушнил. Но если коротко, то
в математике это конкретное число характеризующее распределение. В покере же это синоним неудачи на краткосроке в любой форме. Меня переехали на ривере - дисперсия.
если скажем мы играем холдем, то там стандартное отклонение ~80-100bb/100 - этот показатель можно в трекере посмотреть чтобы понять какая игра \ игрок \ ситуация "дисповее". И продвинутые покеристы считают это вот дисперсией. Что тоже не верно, т.к. это стандартное отклонение, которое надо возвести в квадрат чтобы получить дисперсию. Но это не надо делать, т.к. тогда станет вообще ничего не понятно. В покере все оперируют стандартным отклонением, а не дисперсией, но при этом если сделать поиск по форуму, то второе в 100 раз чаще встречается.
И опять же. Практическое понимание дисперсии как математического объекта позволяет извлекать знания из баз данных. Жаргонное не позволяет. Можно например зная дисперсию игры оценить насколько у нас "правдивый" винрейт в ней, вероятность даунстрика, необходимый банкрол и т.д.
Ну и да, использовать жаргон это нормально. Сам тоже использую, но могу переключать контексты.
SnowBeaver, я это уточнил, чтобы до конца понять твою мысль. Если я правильно понял, то основная проблема, что люди используют термины не по назначению и вкладывают в них разные смыслы. Согласен с этим. Чаще всего не имеет смысла начинать дискуссию, потому что собеседник использует термины только в ему понятном смысле. Зачастую он и сам не понимает смысла того что пишет. Но это, вроде как, основная проблема человеческого общения. Язык нашего общения не является формальным, в отличии от математики, например.
В термин "ГТО" форумчане вкладывают десятки смыслов. Пойди разбери, что они имеют ввиду.
Есть такая байка, что одного известного математика спросили не беспокоит ли его, что математика так сложна, что его работу понимают буквально несколько человек в мире. На что он ответил, что математику хоть кто-то понимает, в отличие от обычного языка.
Kyka, современное покерное GTO это тема близкая к религии. Карго-культ, который говорит, что ести ты его задрочишь, то прилетят американцы ты начнёшь люто тащить в покере. Переубеждать людей в обратном бесполезно. Те кому надо это и так знают, а другие не поймут.
если человек от вкладывания своих смыслов в термины извлекает для себя пользу (желательно выраженную в деньгах), то он молодец. Но как правило этого не происходит, и выгоднее разобраться как оно там в математике.
а я тут соглашусь с точкой зрения SnowBeaver, просто все почему-то решили что GTO = nash, но это странно. оптимальность в моем понимании это максимизация выигрыша при всех вводных. максимизация выигрыша == минимизация проигрыша на определенных вводных данных. перечитал, я фактически то же самое чуть по-другому говорю, "Ну т.е. делаешь наилучшее решение доступное в теории на основе всех данных которые у тебя есть", просто под "вводными данными" я имею в виду конкретную ситуацию в которой принимается решение, и эта ситуация является динамической (то есть вводные данные корректируются постоянно).
кмк, это все вопросы терминологии.