разбор пари между Тайлером, Витей и Буглменом без флуда

19
Статистика
Статистика
19
Статистика темы
  • Популярность
    Топ-5171
  • Постов
    178
  • Просмотров
    60,161
  • Подписок
    19
  • Карма автора
    +14,601
1 3 4 5 6 9
  • я - спать. Завтра утром окончательно утвердим формулировки (мало ли, всё-таки у Вити будут ещё возражения) и перейдём к аргументированию позиций. Если Витя раньше подтвердит, что согласен - можете сразу начинать аргументировать.
    Ответить Цитировать
    24/55
    + 0
  • слово лучше в этой формулировке можно заменить на что-нибудь более материальное(матожидание или что-то типа этого)?

    беспокоит следующий вопрос допустим Тайлер или я доказали что это утверждение равносильно фразе
    яблоко лучше апельсина

    правильно я понимаю что в этом случае утверждение считается недоказанным?
    Ответить Цитировать
    14/26
    + 0
  • во избежание бардака давайте установим такой регламент: сторона аргументирует, потом я уточняю то, что кажется мне неоднозначным, а потом я даю слово оппонентам для возражений. Пока я слово не дал - возражать не надо.
    Ответить Цитировать
    25/55
    + 1
  • vitja11111 @ 5.3.2015
    слово лучше в этой формулировке можно заменить на что-нибудь более материальное(матожидание или что-то типа этого)?

    беспокоит следующий вопрос допустим Тайлер или я доказали что это утверждение равносильно фразе
    яблоко лучше апельсина

    правильно я понимаю что в этом случае утверждение считается недоказанным?


    слово "Лучше" звучит в ваших переписках неоднократно. Слово "матожидание" не звучало ни разу. Поэтому в формулировке пари присутствует именно слово "лучше". Также там присутствует слово "оптимальный".
    При этом, естественно, любой критерий "лучшести" и "оптимальности", который захочет ввести любой участник, оценивать буду я. И если кто-то захочет утверждать, что "лучше" означает, например, "вскрыть как можно больше банков, потому что это весело", то вряд ли я такой критерий приму.
    Понятно, что "лучше" я буду трактовать как улучшение результата для игрока. А результат измеряется только и исключительно в выигранных деньгах.
    Ответить Цитировать
    26/55
    + 3
  • согласен на формулировку
    Ответить Цитировать
    15/26
    + 0
  • условий пари
    Ответить Цитировать
    16/26
    + 0
  • ок, формулировку удалось утвердить чисто на доброй воле участников, без насилия :). Это уже моя маленькая победа :)

    Можете переходить к аругментам.
    Ответить Цитировать
    27/55
    + 0
  • Khishtaki @ 5.3.2015
    При этом, естественно, любой критерий "лучшести" и "оптимальности", который захочет ввести любой участник, оценивать буду я.


    С этим я согласен.

    Khishtaki @ 5.3.2015
    Понятно, что "лучше" я буду трактовать как улучшение результата для игрока. А результат измеряется только и исключительно в выигранных деньгах.


    А с этим нет. Слово "лучше" как и "оптимально" подразумевает максимизацию всех возможных выгод для игрока в рамках задачи.

    Рассмотрим такой пример: "Человек смертельно болен и ему нужна операция, которая стоит 10.000$, этих денег у него нет и нет возможности их занять или заработать и вообще жить ему осталось скажем 1 минуту. Ему предлагают сыграть в игру - 100$ сразу или 10.000$ с вероятностью в 1% (если он выберет 10.000$ и выиграен он выживет)" Какая стратегия для него будет оптимальной (лучшей)?

    EV обоих действий в выигранных деньгах одинаково, но количество выгод, которое он получает от обоих вариантов разное.
    Сообщение отредактировал TylerRM - 6.3.2015, 1:45
    Ответить Цитировать
    15/43
    + -29
  • Khishtaki @ 5.3.2015
    Утверждение Вити: Утверждение Тайлера «Стратегия для первого игрока - отправлять весь диапазон в линию бета не является теоретически оптимальной стратегией.
    Теоретически оптимальной стратегией же будет отправлять в диапазон чека небольшое количество велью-рук.» где под теоретически оптимальной стратегией Тайлер понимает «Это GTO - равновесие нэша.» и тут же поясняет «Лучшая, из всех возможных стратегий, при условии неизвестной стратегии оппонента.» - ЛОЖНО.


    в посте 6656 в дневнике Тайлера пояснено что являются или не являются равновесием по Нэшу в совокупности со стратегией второго игрока всегда пас и чек бихайнд https://forum.gipsyteam.ru/index.php?viewtopic=53683&st=6640

    назовем Стратегия для первого игрока - отправлять весь диапазон в линию бета- стратегия 1
    отправлять в диапазон чека небольшое количество велью-рук ибетить остальное - стратегия 2
    стратегия второго игрока всегда пас и чек бихайнд стратегия а

    комбинация стратегий 1а является равновесием Нэша

    напомню что в первоначальной задаче банк и стеки игроков равны 8

    ожидание изменения стека первого игрока +8 второго 0

    первый игрок как не меняет стратегию не может выиграть больше 8 если второй игрок всегда падает и чекает в ответ на чек

    так как в диапазоне первого велью рук больше двух третей от общего количества
    то если второй игрок начнет что-то колировать его ожидание станет отрицательным то есть ухудшится

    таким образом совокупность стратегий 1а это равновесие Нэша что уже на мой взгляд делает высказывание Тайлера ложным.

    совокупность стратегий 2а также является равновесием по Нэшу.

    добавлю так же:

    http://www.uapoker.info/blog/foolosopher/ponimanie-igrovoi-teorii-perevod-42313
    тут нашел определение гто стратегии

    Оптимальная теория игры (GTO): стратегия, которая дает вам максимально возможное EV (или, другими словами, “является оптимальной”), если ваш оппонент всегда использует против вас лучшую контр-стратегию.

    так как игрок1 не может получить ожидание больше 8 какую бы стратегию не использовал если игрок2 использует стратегию а,
    то ожидание любой стратегии первого игрока против оптимальной контрстратегии второго игрока не превосходит 8
    ожидание же стратегии1 против любой стратегии игрока 2 больше либо равно 8

    значит стратегия1 является gto стратегией что также делает высказывание Тайлера ложным


    «Лучшая, из всех возможных стратегий, при условии неизвестной стратегии оппонента.» по поводу этого ничего сказать не могу так как не очень понятно что это означает с математической точки зрения. возможно предлагается проинтегрировать матожидание стратегии по множеству контрстратегий? но тогда на этом множестве надо наверно ввести какую-то меру.
    в общем как с этой точки зрения сравнить две стратегии я не понимаю
    Ответить Цитировать
    17/26
    + 2
  • Khishtaki @ 5.3.2015
    Можете переходить к аругментам.


    Для начала, чтобы было понятней, вернемся к моему изначальному определению оптимальной стратегии. Оптимальная стратегия - это стратегия, которая является лучшей против совокупности всех возможных стратегий, которые может предпринять оппонент.

    Если она является лучшей, то должны быть четкие критерии, по которым мы можем сравнивать разные стратегии и определить какая из них является лучшей.

    Я вижу два очевидных критерия:
    1) Ожидание.
    2) Дисперсия.

    Ожидание.

    Чтобы построить крепкую стратегию в данном примере, мы должны для начала сбалансировать диапазон нашей ставки.
    У нас 20% воздуха в спектре, исходя из размера ставки мы можем посчитать оптимальное отношение блефов к вельюбетам, чтобы определить, какое количество вельюбетов мы должны добавить чтобы отжать у оппонента банк вне зависимости от того, что он выбирает. А (альфа) = BET / (BET+POT) = 33.3%. Значит, мы должны 20% наших блефов, сбалансировать 40% вельюбетов, чтобы их отношение друг к другу было равно альфе.

    Таким образом мы автоматически получаем ожидание размером, как минимум, в банк, вне зависимости от того как играет оппонент.

    Далее у нас образуется набор стратегий, которые имеют одинаковое ожидание против любых возможных стратегий оппонента:
    20% - ставка в воздухом.
    40% - ставка с натсами.
    [0%;40%] - чек с воздухом.
    [0%;40%] - чек с натсами.

    Вне зависимости от того, куда мы распределим оставшиеся натсы, ожидание от стратегии будет одинаковым против любой возможной стратегии оппонента (надеюсь это доказывать не нужно и все с этим согласятся).

    2) Дисперсия

    Если с ожиданием всё понятно, и моя стратегия и предложенная Рави и Витей имеют одинаковое ожидание, то с дисперсией всё не так однозначно.

    Для начала рассмотрим отвлеченный пример. Если мы играем в игру "забрать 100$ или 10.000$ с вероятностью 1%", то при одинаковом EV обоих дейстивый и отсутствии дополнений вроде того которое я привел в предыдущем посте, первый вариант с минимальной дисперсией будет являться лучшим (или оптимальным). Все мы покеристы и мы, как никто другие знаем, что если два действия имеют одинаковое EV, то нужно выбирать то, которое имеет наименьшую дисперсию. Мне тяжело представить, чтобы какой-нибудь рациональный человек (например феруель), сказал, нет, в этой игре оптимально будет выбрать 10.000$ с вероятностью в 1%. Нет, феруель так никогда не скажет. Человек склонный к лудомании может так ответить. Человек со специфичной жизненной ситуацией, которому жизненно необходимы 10.000$ может ответить, что выберет вероятность в один процент и для него это будет оптимально. Но, без дополнительных уточнений к задаче, я склонен утверждать, что, при одинаковом EV двух действий, действие с минимальной дисперсией будет являться оптимальным.

    Теперь перейдем к нашему примеру.
    У оппонента в матрице решений есть возможность совершить две ошибки (поставить в чек и заколлировать ставку).

    После того, как мы сбалансировали диапазон ставки у нас осталось еще 40% натсов, которые мы можем распределить в две линии. Любая стратегия с распределением натсов от [0%;40%] в спектр чека и ставкой 20% блефов 40% натсов и всех оставшихся натсов, которые не вошли в спектр чека будет иметь одинаковое ожидание. Вопрос стоит в том, какая из них будет иметь наименьшую дисперсию?

    Давайте разберемся. Оппонент может совершить две возможные ошибки. По условиям задачи, мы считаем, что:
    а) Он может их совершать
    б) Мы считаем их равновероятными, так как у нас нет никакой информации об оппоненте.

    Если мы переносим все эти нераспределенные натсы в спектр бета, то мы не зарабатываем дополнительных денег, если оппонент совершает 1-ую ошибку (ставить в наш чек), но дополнительно зарабатываем 40% банка, когда он совершает вторую ошибку (коллировать ставку).

    Если мы переносим эти натсы в спектр чека, то мы не зарабатываем никаких дополнительных денег, если оппонент совершает 2-ую ошибку, при этом зарабатываем те же 40% банка, когда он совершает 1-ую ошибку (ставить в наш чек).

    Если мы разнесем одинаково эти натсы между чеком и бетом, то мы будем зарабатывать дополнительно 20% банка, когда оппнент сделает первую ошибку и еще 20% банка, когда сделает вторую ошибку. То есть при каждой ошибке, будем зарабатывать 20% банка.

    Другими словами теперь игру можно представить следующим образом:
    Оппонент может совершить два типа ошибки, совершает их с одинаковой частотой.
    Мы можем выбрать заработать N$, когда он совершит любую из возможных ошибок, или 2*N$ каждый раз когда совершит одну конкретную из них.

    Дополнение (насчет вывода моей стратегии):
    Для того, чтобы вывести стратегию, которая в равной степени эксплуатирует обе ошибки, мы должны сделать наше ожидание от одной ошибки равным ожиданию от другой ошибки. Допустим X% - частота с которой мы играем чеком с данным нам 40%-ым диапазоном, который мы должны распределить. Тогда (100%-X%) - частота с которой мы играем бетом.

    X%*(EVBLUFFMISTAKE) = (100%-X%)*(EVCALLMISTAKE)

    В данном случае, при одинаковом сайзинге ставки, ожидание от кола оппонента будет равно ожиданию от ставки в наш чек, поэтому в половине случаев наш нераспределенный 40%-ый спектр натсов мы отправляем в чек, в половине случаев в бет.
    *при различных сайзингах ставки, ожидание было бы разным и соответственно распределение рук была бы иным.

    Итого наша стратегия, уравнивающая стоимость каждой ошибки для оппонента, выглядит так:
    20% - чек с натсами
    60% - бет с натсами
    20% - блеф с воздухом

    Если мы сравним в отношении дисперсии сравним данную стратегию, с предложенной Рави и Витей.
    Мы найдем аналогию со следующим примером:
    В случае ошибки оппонента, мы можем получить либо 20%*POT (когда он совершит любую из двух ошибок), либо 40%*POT но в два раза
    реже (когда он совершит только одну конкретную ошибку - заколлирует ставку). Какая из двух стратегий будет оптимальной? (вопрос риторический).

    В условиях пари было уточнение, что я должен доказать, что не только стратегия Рави и Вити уступает моей, но и остальные, которые от неё отличаются. Это можно сделать по аналогии.

    Исключение составляет, лишь стратегия со случайным выбором из тех, которые имеют максимальное ожидание:
    20% - ставка в воздухом,
    40% - ставка с натсами.
    [0%;40%] - чек с воздухом.
    [0%;40%] - чек с натсами.

    Но она отличается от моей лишь формулировкой и по сути является моей стратегией.

    Подводя итог поста, я считаю, что при обсуждении оптимальной стратегии, мы не можем игнорировать вопросы дисперсии и при одинаковом эквити двух стратегий, оптимальной будет являться та, которая имеет меньшую дисперсию.

    Если у господина Муна или у участников спора есть какие-то вопросы по аргументации, задавайте, я на них отвечу.
    Сообщение отредактировал TylerRM - 6.3.2015, 8:07
    Ответить Цитировать
    16/43
    + 0
  • vitja11111 @ 5.3.2015
    Оптимальная теория игры (GTO): стратегия, которая дает вам максимально возможное EV (или, другими словами, “является оптимальной”), если ваш оппонент всегда использует против вас лучшую контр-стратегию.


    Ты прав насчет того, что гто стратегия (оптимальная), дает максимально возможно EV, если наш оппонент всегда использует против нас лучшую контр-стратегию. Однако я считаю, что это определение не является полным (это лишь свойство GTO стратегии) и требует дополнений, так как слово оптимальное подразумевает максимальное количество всех возможных выгод.

    Так, любое сочетание оптимальных стратегий игроков всегда будет являться равновесной парой, но не каждая равновесная пара будет являться оптимальной стратегией.

    В своей аргументации я показал, что не каждая стратегия дающая максимально возможное EV будет оптимальной.
    Для того, чтобы опровергнуть мою аргументацию, ты должен доказать, что "снижение дисперсии", не является выгодой для игрока.
    Сообщение отредактировал TylerRM - 6.3.2015, 8:09
    Ответить Цитировать
    17/43
    + -1
  • Я бы хотел попросить судью вначале решить спор с Витей, а потом уже, после вынесенного решения, взяться за спор с Рави.
    Потому, что он не подтвердил мой пост и из-за этого формулировку с его спором, возможно, нужно будет пересмотреть.
    Сообщение отредактировал TylerRM - 6.3.2015, 6:24
    Ответить Цитировать
    18/43
    + 0
  • То есть ты хочешь несколькими способами доказывать свое утверждение, в зависимости от того, кто твой оппонент?
    Ответить Цитировать
    11/22
    + 0
  • Хиштаки, мы же уже перешли к аргументациям и закрыли вопрос о формулировке спора? Я могу считать пост #70 доказательством Тайлера своего утверждения в споре со мной?
    Ответить Цитировать
    12/22
    + 2
  • TylerRM @ 6.3.2015
    Я бы хотел попросить судью вначале решить спор с Витей, а потом уже, после вынесенного решения, взяться за спор с Рави.
    Потому, что он не подтвердил мой пост и из-за этого формулировку с его спором, возможно, нужно будет пересмотреть.


    нет, так не пойдёт. Я готов выслушать твои предложения по изменению формулировки, но считаю изменение её постфактум довольно маловероятным.
    Ответить Цитировать
    28/55
    + 0
  • Khishtaki, если я покажу, что мое равновесие лучше, чем равновесие рааи, я могу у него выиграть?
    Ответить Цитировать
    19/43
    + 0
  • Я могу численно показать, что обе стратегии первого игрока
    А) со 100% бетом
    Б) с чеком 20% натсов
    имеют одинаковое ожидание в каждом из этих случаев
    1) второй игрок оптимизирует свое ожидание
    2) второй игрок выбирает свою стратегию случайным образом

    В этом случае я докажу утверждение Вити (не специально, просто из этого будет прямо следовать) и опровергну утверждение Андрея. Тогда я выигрываю спор, я правильно понимаю? Вроде в таком случае никаких лазеек для Андрея не должно остаться.
    Ответить Цитировать
    13/22
    + 2
  • напишите, пожалуйста, когда можно доказательство Тайлера начинать опровергать
    Ответить Цитировать
    18/26
    + 0
  • Boogleman1 @ 6.3.2015
    Я могу численно показать, что обе стратегии первого игрока
    А) со 100% бетом
    Б) с чеком 20% натсов
    имеют одинаковое ожидание в каждом из этих случаев
    1) второй игрок оптимизирует свое ожидание
    2) второй игрок выбирает свою стратегию случайным образом


    Мне бы хотелось, чтобы доказательство было максимально подробным, длинным, математика была сделана четко и ясно, в начале и в конце неплохо будет вставить пару метафор. Вобщем оно должно быть таким, чтобы ни у кого (включая меня) не осталось и капли сомнений, что обе стратегии имеют одинаковое ожидание.
    Сообщение отредактировал TylerRM - 6.3.2015, 10:58
    Ответить Цитировать
    20/43
    + 0
  • TylerRM @ 6.3.2015
    Khishtaki, если я покажу, что мое равновесие лучше, чем равновесие рааи, я могу у него выиграть?


    нет, ты не можешь выиграть, Рави недвусмысленно формулировал своё утверждение, которое является истинным, поэтому он проиграть деньги никак не может, у него, считай, фриролл.
    Ответить Цитировать
    29/55
    + 3
1 3 4 5 6 9
1 человек читает эту тему (1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.