разбор пари между Тайлером, Витей и Буглменом без флуда

19
Статистика
Статистика
19
Статистика темы
  • Популярность
    Топ-4864
  • Постов
    178
  • Просмотров
    59,757
  • Подписок
    19
  • Карма автора
    +14,676
1 4 5 6 7 9
  • сейчас подождите, я вчитаюсь в аргументы Вити и Тайлера и, если возникнет необходимость, задам уточняющие вопросы. Потом уже оппоненты смогут опровергать.
    Ответить Цитировать
    30/55
    + 0
  • vitja11111, твои тезисы, насколько я их понял, выглядят так:
    1. "твоя" стратегия является равновесием Нэша, поэтому утверждение Тайлера, что не является - ложно
    2. "твоя" стратегия является ГТО, поэтому утверждение Тайлера, что не является - ложно
    3. "теоретически оптимальная стратегия" - термин не математический, поэтому подтвердить или опровергнуть его невозможно.

    Ок, твои аргументы я воспринял, если у Тайлера есть возражения - можно высказывать. А я перейду к чтению аргументов Тайлера.
    Ответить Цитировать
    31/55
    + 0
  • небольшие пояснения
    Khishtaki @ 6.3.2015
    vitja11111, твои тезисы, насколько я их понял, выглядят так:
    1. "твоя" стратегия является равновесием Нэша, поэтому утверждение Тайлера, что не является - ложно
    2. "твоя" стратегия является ГТО, поэтому утверждение Тайлера, что не является - ложно
    3. "теоретически оптимальная стратегия" - термин не математический, поэтому подтвердить или опровергнуть его невозможно.

    Ок, твои аргументы я воспринял, если у Тайлера есть возражения - можно высказывать. А я перейду к чтению аргументов Тайлера.

    небольшие пояснения

    1 моя стратегия является равновесием Нэша в совокупности со стратегией второго игрока
    это основной аргумент которого на мой взгляд достаточно

    на случай если первого аргумента кому-то недостаточно есть аргумент 2
    замечу что для не верности утверждения Тайлера достаточно более общего утверждения:

    стратегия 1 и стратегия 2 являются или не являются гто стратегиями одновременно
    это на случай если возникнет какое-то другое определение гто стратегии

    утверждение 3 скорее просто размышления о смысле жизни
    Ответить Цитировать
    19/26
    + 0
  • vitja11111, уточнения приняты
    Ответить Цитировать
    32/55
    + 0
  • и пункт 3 был не про теоретически оптимальную стратегию а про это:
    «Лучшая, из всех возможных стратегий, при условии неизвестной стратегии оппонента.»
    Ответить Цитировать
    20/26
    + 0
  • TylerRM, в твоей аргументации недоказанным является тезис про то, что дисперсия стратегии "бет 100%" больше, чем дисперсия стратегии "бет 20% блефов, бет 60% натсов, чек 20% натсов". Прошу либо доказать его математически, либо отказаться от него.

    (на самом деле этот тезис неверен, так что я сожалею, но, похоже, твоё утверждение доказать тебе не удалось).
    Ответить Цитировать
    33/55
    + 2
  • Khishtaki, не понял.

    Мы считаем, что оппонент может совершать ошибки. Их две. Они равновероятны (происходят с одинаковой частотой).
    По стратегии Рави мы эксплуатируем одну ошибку, зарабатывая на ней дополнительно 40% банка.
    По моей стратегии, мы эксплуатируем обе ошибки, зарабатывая на них по 20% банка с каждой.

    Таким образом, когда оппонент совершает ошибку, моя стратегия зарабатывает в два раза меньше, чем стратегия Рави, но зато с каждой ошибки.
    А стратегия Рави зарабатывает в два раза больше, но только с одной ошибки, которая происходит с 50% частотой.

    Таким образом задача аналогична следующей.
    В каком из двух решений дисперсия будет меньшей:
    Взять 100$ сразу или 200$ с 50% частотой?

    Что тут не так?
    Ответить Цитировать
    21/43
    + -3
  • Khishtaki, может быть термин просто не подходит, потому что то что я пытаюсь объяснить (а дисперсия все-таки подразумевает какие-то колебания) в науке, называется как-то по-другому?
    Ответить Цитировать
    22/43
    + 0
  • Khishtaki, если я заменю тезис "дисперсия" на тезис "cреднеквадрати́ческое отклоне́ние", мое суждение будет верным?
    Ответить Цитировать
    23/43
    + 0
  • TylerRM @ 6.3.2015
    Таким образом задача аналогична следующей.
    В каком из двух решений дисперсия будет меньшей:
    Взять 100$ сразу или 200$ с 50% частотой?


    не аналогична.

    TylerRM @ 6.3.2015
    Khishtaki, если я заменю тезис "дисперсия" на тезис "cреднеквадрати́ческое отклоне́ние", мое суждение будет верным?

    не будет.
    Ответить Цитировать
    34/55
    + 0
  • щас надо поработать, если до моего возвращения сам не поймёшь, я распишу тебе дерево вариантов - всё увидишь сам.
    Ответить Цитировать
    35/55
    + 0
  • пост 85
    Ответить Цитировать
    21/26
    + 0
  • его пропустили
    Ответить Цитировать
    22/26
    + 0
  • vitja11111 @ 6.3.2015
    и пункт 3 был не про теоретически оптимальную стратегию а про это:
    «Лучшая, из всех возможных стратегий, при условии неизвестной стратегии оппонента.»


    да, тоже принято.
    Ответить Цитировать
    36/55
    + 0
  • дерево вариантов для Тайлера.

    1 стратегия - всегда бет, вторая стратегия - 20% чек натса, бет всё остальное.
    Оппонент с вероятностью 50% коллирует наш бет и чекает наш чек, с вероятностью 50% фолдит наш бет и бетит наш чек.


    Ответить Цитировать
    37/55
    + 11
  • ну что, убедил я тебя? Если да, то высылай, пожалуйста, штукарь Рави сразу, а насчёт Вити у тебя ещё есть шанс - можешь попробовать опровергнуть его утверждения (хотя я, если честно, тоже не вижу, как это можно сделать БЕЗ доказательства твоего тезиса о ПРЕВОСХОДСТВЕ твоей стратегии над его).
    Ответить Цитировать
    38/55
    + 2
  • Господа, простите, что влезаю в вашу дискуссию, но если вы хотите оперировать строгими формулировками, то следует начать с того, что к играм с неполной информацией (коей безусловно является покер) понятие "равновесие Нэша"(Nash equilibrium) неприменимо. Можно говорить о равновесии Нэша в играх с полной информацией (шахматы, шашки, нарды, крестики-нолики, камень-ножницы-бумага), но не в играх, где нет полной информации о типе ваших соперников. В покере, дураке и любых других карточных играх, в отличие от шахмат, вы не знаете не только стратегию, но и тип соперника (т.е. карты у него на руках). Равновесие Нэша же задается только для игр с полной информацией.

    Для игр с неполной информацией используются другие критерии равновесия. "Равновесие Байеса-Нэша"(Bayesian Nash equilibrium), "Совершенное равновесие Байеса"(Perfect Bayesian equilibrium) - основные критерии равновесия в играх с неполной информацией. НО для таких игр характеристика равновесия включает в себя не только набор равновесных стратегий, но и вер (beliefs), которые поддерживают предполагаемое равновесие. Веры определяются по правилу Байеса (поэтому равновесия так и называются). Бессмысленно говорить о равновесных стратегиях, без указания вер.

    Я допускаю, разные стороны пусть неявно, но в голове представляют себе определенные веры. В результате, вполне возможна ситуация, что обе стороны "правы" (только в некотором смысле, поскольку строго говоря, как я говорил выше, "равновесие Нэша" неприменимо к покеру), но надо указывать набор вер, помимо набора стратегий. Я имею в виду, что, возможно, при определенных верах указанные стратегии будут частью равновесия, а при других верах не будут (скорее всего так и есть, но я точно не проверял).

    В общем, я не советую вам использовать понятия теории игр, если вы не до конца уверены, что понимаете, что именно вы обсуждаете. Пока же, то что вы обсуждаете - это какие-то суррогаты теории игр.

    P.S. Про ГТО я сказать ничего не могу, т.к. в теории игр такого понятия нет, это чисто покерная терминология и здесь я недостаточно компетентен, чтобы делать выводы. Может быть, если убрать сочетание "равновесие Нэша", то утверждения имеют смысл с точки зрения ГТО, но, повторюсь, этого я не знаю.
    Ответить Цитировать
    1/2
    + -31
  • Khishtaki @ 6.3.2015
    ну что, убедил я тебя? Если да, то высылай, пожалуйста, штукарь Рави сразу, а насчёт Вити у тебя ещё есть шанс.


    Подожди пожалуйста с такими выводами.

    TylerRM @ 6.3.2015
    Рассматриваем только ту линию игры (точнее группу линий), где оппонент совершает ошибки.
    Допустим мы играем с оппонентом 2 раунда.

    Банк равен 100 фишкам (для удобства подсчета).

    В теории из 2 раз когда он сделал ошибку, оппонент должен был бы 1 раз ошибиться с колом ставки и 1 раз ошибиться с ставкой в чек.

    С моей стратегией (во всех формулах сразу ставим сбалансированные велью + блефы, дальше велью, дальше чекаем велью):
    В первом раунде мы выигрываем: 60%*100+20%*200+20%*100 = 60+40+20 = 120 фишек
    Во втором раунде мы выигрываем: 60%*100+20%*100+20%*200 = 60+20+40 = 120 фишек

    Со стратегией оппонента (рави):
    В первом раунде мы выигрываем: 60%*100+40%*200 = 60+80 = 140 фишек
    Во втором раунде мы выигрываем: 60%*100+40%*100 = 60+40 = 100 фишек

    В теории оппонент ошибается равнозначно.
    Значит в 25% случаях будет такой ран, где из двух раз он оба раза ошибется со ставкой в чек и ни разу с колом ставки.

    Тут то мы с моей стратегией и покажем больший результат:
    В первом раунде мы выиграем: 60%*100+20%*100+20%*200 = 60+40+20 = 120 фишек
    Во втором раунде мы выигрываем: 60%*100+20%*100+20%*200 = 60+20+40 = 120 фишек
    ------------------------------------------------------------------
    Суммарно 240 фишек

    А стратегия Рави покажет больше:
    В первом раунде: 60%*100+40%*100 = 100 фишек
    Во втором раунде: 60%100+40%*100 = 100 фишек
    ------------------------------------------------------------------
    Всего 200 фишек

    Также естественно еще в 25% случаях будет ран, где оппонент два раза ошибется с колом ставки и ни разу со ставкой в чек.

    Тут моя стратегия покажет по прежнему 240 фишек.

    А стратегия Рави покажет:
    В первом раунде 60%*100+40%*200 = 140 фишек
    Во втором раунде 60%*100+40%*200 = 140 фишек
    ----------------------------------------------------------------
    Суммарно 280 фишек

    Еще в 50% случаях наши стратегии обе покажут по 240 фишек в ожидании.

    В итоге график выигрышей в моей стратегии при ошибках оппонента будет ровно по диагонали (+120 фишек за каждый раунд) вверх.
    График Рави будет зависет от того, насколько в определенном ране ему везло с ошибками оппонента. Если ему везло и оппонент выбирал благоприятную ему ошибку Рави получает 140 фишек за раунд, если не повезло то 100 фишек за раунд.

    То есть его график будет вырываться сильнее вперед, если ему везло, и отставать от моего, если невезло.

    Где это можно просто программно наглядно расчитать и вывести дисперсию и график отклонений от ожидаемого результата?
    Ответить Цитировать
    24/43
    + -1
  • ritsar, игра, описанная в пари - это игра с полной информацией, она же разбивается по дереву однозначно. Разве нет?
    Ответить Цитировать
    39/55
    + 0
  • Khishtaki @ 6.3.2015
    дерево вариантов для Тайлера.


    То что сделал ты, насколько я понимаю - рассмотрел полный цикл, где наше ожидание просто одинаково.

    Так, если мы бросаем монетку - наше ожидание будет равно 0 и на полном цикле можно сказать, будто дисперсии нет, что естественно не верно.
    Ответить Цитировать
    25/43
    + 6
1 4 5 6 7 9
1 человек читает эту тему (1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.