Neeel | 45 |
PusheeR | 38 |
Vinni121 | 32 |
iHaveOnly26Teeth | 26 |
Katoshikufu | 17 |
Цитата
«Мы отрабатываем алгоритм на покере, но возможности их применения гораздо шире, – говорит Сандхольм. – Борьба с киберпреступностью, торговля, медицина...»
Цитата (Uran @ 26.4.2015)
Гто похоже на многомерный калейдоскоп. Если чуть чуть сдвинуть одно из зеркал или переместить цветное стеклышко, то свет за большое количество отражений сильно меняет свои характеристики, так что картина на выходе меняется радикальным образом.
Цитата (Uran @ 27.4.2015)
Равновесие ищется путем одновременного проходам по всем доскам, всем веткам с полным вектором состояний карт игроков, потом после такой глобальной итерации по всем состояниям системы происходит пересчет стратегии и новая итерация.
Цитата (Uran @ 27.4.2015)
Равновесие ищется путем одновременного проходам по всем доскам, всем веткам с полным вектором состояний карт игроков
Цитата (Vinni121 @ 27.4.2015)
Там этих веток не охуиллиарды разве? Чуть ранее звучало о "стратегии на 12 терабайт", на первый взгляд количество информации (веток розыгрыша) должно быть на много порядков выше.
Цитата (Vinni121 @ 27.4.2015)
Новая стратегия считается как подстройка под старую стратегию (или может частичный сдвиг в сторону этой подстройки) или каким иным способом?
Или методом дребезжания стратегии? К примеру есть в нашей известной стратегии множество параметров (к примеру для какой-то комбинации уменьшаем вероятность трибета с ней и учащаем розыгрыш колд коллом)?
Цитата (Uran @ 26.4.2015)
Похоже со вчерашнего дня боту включили мягкий эксплойт RNR (Restricted Nash Response, "безопасный" эксплоит: расчет равновесия взвешивается моделью оппонента до степени достоверности в каждом контексте. Полученное решение, которое эксплоитит "верняк" и не дает себя обыграть во всех остальных случаях). Прямых данных на это пока нет, но множество косвенных. А это уже совсем другой покер.
Цитата (TeelXp @ 27.4.2015)
Почему ты так решил? Рук там не особо много что бы говорить о подстройки, да и ребята из Карнеги-Меллон вроде никогда не использовали RNR. В общем случае алгоритм у них скорее всего следующий: до ривера играть по равновесию, заранее рассчитанному в бакетах, на ривере используя информацию о поставленных сайзингах построить вменяемое по размерам дерево и посчитать его с флопа без бакетов.
Цитата (Uran @ 27.4.2015)
Равновесие ищется путем одновременного проходам по всем доскам, всем веткам с полным вектором состояний карт игроков, потом после такой глобальной итерации по всем состояниям системы происходит пересчет стратегии и новая итерация. Это как если бы мы посветили светом в калейдоскоп и посмотрели бы на полученное отражение, потом одновременно поменяли бы положение всех зеркал по определенному алгоритму и снова бы посмотрели как свет отразился во всех плоскостях, пока не нашли бы нужную нам картину.
Цитата (Uran @ 27.4.2015)
У тебя есть дерево. в каждом ноде, отображающем игровое действие с неким сайзингом, у тебя находятся стратегии для всевозможных состояний рук-доска с запоминанием порядка прихода карт. стратегия получается из такого параметра как сожаление. Чем выше сожаление тем реже данное действие будет применено для данной руки. за каждый проход вектора рук по всевозможным доскам и веткам игры редактируется стратегия сожаления и так итеративно с помощью его минимизации, находится равновесие.
Это точно? А то я совсем не шарю в этом твитче, не могли бы ссылки выложить на все предыдущие матчи, вчерашние к примеру. А ещё лучше пояснить подробнее как их самому находить.