The Times They Are a-Changin’

Последний пост:27.10.2022
840
Статистика
Всего постов
1842
827,800 просмотров
Новых постов
+0
0 в день
Лучшие посты автора
14.04.2013 +215
14.04.2013 +213
23.12.2012 +206
14.04.2013 +163
07.01.2015 +123
Лучшие посты читателей
abacaba +189
Felixillo +146
PusheeR +141
Fellini +136
leshick +124
Самые активные читатели
1 34 54 55 56 57 76 93
  • Цитата (bart_ekb @ 25.4.2015)
    PykaNoga, дак на канале автоматически сохраняется, появится по той же ссылке в предыдущих трансляциях


    Это точно? А то я совсем не шарю в этом твитче, не могли бы ссылки выложить на все предыдущие матчи, вчерашние к примеру. А ещё лучше пояснить подробнее как их самому находить.
    3/6
    Ответить Цитировать
    0
  • Всё, разобрался.
    4/6
    Ответить Цитировать
    0
  • Похоже со вчерашнего дня боту включили мягкий эксплойт RNR (Restricted Nash Response, "безопасный" эксплоит: расчет равновесия взвешивается моделью оппонента до степени достоверности в каждом контексте. Полученное решение, которое эксплоитит "верняк" и не дает себя обыграть во всех остальных случаях). Прямых данных на это пока нет, но множество косвенных. А это уже совсем другой покер.
    259/512
    Ответить Цитировать
    5
  • Цитата
    «Мы отрабатываем алгоритм на покере, но возможности их применения гораздо шире, – говорит Сандхольм. – Борьба с киберпреступностью, торговля, медицина...»


    Uran, как ты это понимаешь? Как они смогут применить свои наработки в других областях?
    2/2
    Ответить Цитировать
    1
  • В покере мы видим как распределяются спектры наших рук в зависимости от ситуации. Они появляются как следствие взаимоподстройки. Этот процесс моделируется при расчете гто. В случае когда есть две противоборствующие стороны, можно их действия замоделировать и в любой временной срез посмотреть какая текущая стратегия за обе стороны и как она будет проявляться. К примеру битва между опухолью и организмом. На основе большой выборки мы можем замоделировать на компьютере данный процесс и оценить возможные варианты развития опухоли, что облегчит ее поиск и лечение. imho
    260/512
    Ответить Цитировать
    14
  • https://www.youtube.com/watch?v=X40Zd3spxcc

    Довольно интересное видение мира у человека.
    Сообщение отредактировал Uran - 27.4.2015, 2:48
    261/512
    Ответить Цитировать
    9
  • Гто похоже на многомерный калейдоскоп. Если чуть чуть сдвинуть одно из зеркал или переместить цветное стеклышко, то свет за большое количество отражений сильно меняет свои характеристики, так что картина на выходе меняется радикальным образом. К примеру когда мы считаем равновесие в хапе мы знаем что не будем играть такую руку ка 72о ни за опен рэйзера ни за коллера, но несмотря на это, мы не можем выкинуть из расчетов эту руку, так как даже отсутствие такой не играющей руки, изменит финальное равновесие. Потому что гто это суперпозиция всех состояний, даже не реализуемые состояния нельзя выкидывать.
    262/512
    Ответить Цитировать
    8
  • Цитата (Uran @ 26.4.2015)
    Гто похоже на многомерный калейдоскоп. Если чуть чуть сдвинуть одно из зеркал или переместить цветное стеклышко, то свет за большое количество отражений сильно меняет свои характеристики, так что картина на выходе меняется радикальным образом.


    Я так понимаю равновесие таким "смещением стёклышек" и ищется? Если нет, то какова центральная идея алгоритма?

    Если да, то каковы гарантии того, что существует стабильное состояние системы, которое не будет перетекать в другое при продолжении поисков?
    6/32
    Ответить Цитировать
    0
  • Равновесие ищется путем одновременного проходам по всем доскам, всем веткам с полным вектором состояний карт игроков, потом после такой глобальной итерации по всем состояниям системы происходит пересчет стратегии и новая итерация. Это как если бы мы посветили светом в калейдоскоп и посмотрели бы на полученное отражение, потом одновременно поменяли бы положение всех зеркал по определенному алгоритму и снова бы посмотрели как свет отразился во всех плоскостях, пока не нашли бы нужную нам картину.
    263/512
    Ответить Цитировать
    2
  • Цитата (Uran @ 27.4.2015)
    Равновесие ищется путем одновременного проходам по всем доскам, всем веткам с полным вектором состояний карт игроков, потом после такой глобальной итерации по всем состояниям системы происходит пересчет стратегии и новая итерация.


    Новая стратегия считается как подстройка под старую стратегию (или может частичный сдвиг в сторону этой подстройки) или каким иным способом?

    Или методом дребезжания стратегии? К примеру есть в нашей известной стратегии множество параметров (к примеру для какой-то комбинации уменьшаем вероятность трибета с ней и учащаем розыгрыш колд коллом)?
    7/32
    Ответить Цитировать
    0
  • Цитата (Uran @ 27.4.2015)
    Равновесие ищется путем одновременного проходам по всем доскам, всем веткам с полным вектором состояний карт игроков


    Там этих веток не охуиллиарды разве? Чуть ранее звучало о "стратегии на 12 терабайт", на первый взгляд количество информации (веток розыгрыша) должно быть на много порядков выше.
    8/32
    Ответить Цитировать
    0
  • Цитата (Vinni121 @ 27.4.2015)
    Там этих веток не охуиллиарды разве? Чуть ранее звучало о "стратегии на 12 терабайт", на первый взгляд количество информации (веток розыгрыша) должно быть на много порядков выше.


    12 терабайт это сильно ужатая версия хэдзапной лимитки.
    А если говорить о безлимитном дереве в хапе, то по 10 сайзингов на улицу и по 5 рэйзов, то речь будет уже идти уже даже не о пентабайтах памяти.
    264/512
    Ответить Цитировать
    1
  • Цитата (Vinni121 @ 27.4.2015)
    Новая стратегия считается как подстройка под старую стратегию (или может частичный сдвиг в сторону этой подстройки) или каким иным способом?

    Или методом дребезжания стратегии? К примеру есть в нашей известной стратегии множество параметров (к примеру для какой-то комбинации уменьшаем вероятность трибета с ней и учащаем розыгрыш колд коллом)?


    У тебя есть дерево. в каждом ноде, отображающем игровое действие с неким сайзингом, у тебя находятся стратегии для всевозможных состояний рук-доска с запоминанием порядка прихода карт. стратегия получается из такого параметра как сожаление. Чем выше сожаление тем реже данное действие будет применено для данной руки. за каждый проход вектора рук по всевозможным доскам и веткам игры редактируется стратегия сожаления и так итеративно с помощью его минимизации, находится равновесие.
    265/512
    Ответить Цитировать
    0
  • Цитата (Uran @ 26.4.2015)
    Похоже со вчерашнего дня боту включили мягкий эксплойт RNR (Restricted Nash Response, "безопасный" эксплоит: расчет равновесия взвешивается моделью оппонента до степени достоверности в каждом контексте. Полученное решение, которое эксплоитит "верняк" и не дает себя обыграть во всех остальных случаях). Прямых данных на это пока нет, но множество косвенных. А это уже совсем другой покер.

    Почему ты так решил? Рук там не особо много что бы говорить о подстройки, да и ребята из Карнеги-Меллон вроде никогда не использовали RNR. В общем случае алгоритм у них скорее всего следующий: до ривера играть по равновесию, заранее рассчитанному в бакетах, на ривере используя информацию о поставленных сайзингах построить вменяемое по размерам дерево и посчитать его с флопа без бакетов.
    2/3
    Ответить Цитировать
    0
  • Цитата (TeelXp @ 27.4.2015)
    Почему ты так решил? Рук там не особо много что бы говорить о подстройки, да и ребята из Карнеги-Меллон вроде никогда не использовали RNR. В общем случае алгоритм у них скорее всего следующий: до ривера играть по равновесию, заранее рассчитанному в бакетах, на ривере используя информацию о поставленных сайзингах построить вменяемое по размерам дерево и посчитать его с флопа без бакетов.


    Может не RNR а Safe opponent exploitation не суть важно. Если играть до ривера предпросчитанный бакетинг, а ривер считать равновесие с флопа с контекстными сайзингами, то эксплойтабилити там будет адова и чтобы порвать эту хрень достаточно будет рега нл25, Райдер там явно нужен не будет.
    266/512
    Ответить Цитировать
    1
  • Цитата (Uran @ 27.4.2015)
    Равновесие ищется путем одновременного проходам по всем доскам, всем веткам с полным вектором состояний карт игроков, потом после такой глобальной итерации по всем состояниям системы происходит пересчет стратегии и новая итерация. Это как если бы мы посветили светом в калейдоскоп и посмотрели бы на полученное отражение, потом одновременно поменяли бы положение всех зеркал по определенному алгоритму и снова бы посмотрели как свет отразился во всех плоскостях, пока не нашли бы нужную нам картину.


    А есть какое-то понимание, почему это в итоге приведет к "лучшей" стратегии. Мне это неочевидно и даже кажется неверным. Или я чего-то не понимаю ( что гораздо более вероятно ).
    2/5
    Ответить Цитировать
    1
  • Soul,
    попробуй подумать об упрощенном виде покера, можно даже с одной префлоп улицой торговли и одной хоул картой.
    Найди опытным путем гто, пощупай стратегии, посмотри чем лучше, чем хуже.
    После это понимание можно спроицировать на сложные разновидности покера типа холдем.
    26/26
    Ответить Цитировать
    0
  • Цитата (Uran @ 27.4.2015)
    У тебя есть дерево. в каждом ноде, отображающем игровое действие с неким сайзингом, у тебя находятся стратегии для всевозможных состояний рук-доска с запоминанием порядка прихода карт. стратегия получается из такого параметра как сожаление. Чем выше сожаление тем реже данное действие будет применено для данной руки. за каждый проход вектора рук по всевозможным доскам и веткам игры редактируется стратегия сожаления и так итеративно с помощью его минимизации, находится равновесие.


    1) Оппонент играет по нашей стратегии из предыдущей итерации?
    2) Вроде возможно так, что данный алгоритм найдёт локально оптимальную стратегию, но не глобально. Если так, то все результаты пустышка.
    9/32
    Ответить Цитировать
    0
  • Интересно на сколько от своего уровня играет райдер? Уверен, играть свою лучшую игру и стримить для него жирный минус EV. А значит он заинтересован сильно искажать свои действия и где-то совершать не те действия, которые приносят ему наибольший профит. Второй вопрос, на сколько ему нужно выкладываться для победы над ботом. Возможно для него бот по уровню как средний рег и он играет с ним в поддавки.

    Любой результат матча без ответов на эти вопросы не даст оснований сделать верные выводы
    4/4
    Ответить Цитировать
    2
  • Игра против бота вообще очень сильно отличается от игры с обычными людьми и там свои специфические подстройки. ситуации в которых человек обычно будет капнут тут как правило не возникают и бакетной модели свои капнутости и тд. так что Райдер может играть в полную силу против проги и это практически никак не ухудшит его ожидание против живого оппонента.
    267/512
    Ответить Цитировать
    2
1 34 54 55 56 57 76 93
1 человек читает эту тему (1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.