сейчас подождите, я вчитаюсь в аргументы Вити и Тайлера и, если возникнет необходимость, задам уточняющие вопросы. Потом уже оппоненты смогут опровергать.
Khishtaki @ 6.3.2015
vitja11111, твои тезисы, насколько я их понял, выглядят так:
1. "твоя" стратегия является равновесием Нэша, поэтому утверждение Тайлера, что не является - ложно
2. "твоя" стратегия является ГТО, поэтому утверждение Тайлера, что не является - ложно
3. "теоретически оптимальная стратегия" - термин не математический, поэтому подтвердить или опровергнуть его невозможно.
Ок, твои аргументы я воспринял, если у Тайлера есть возражения - можно высказывать. А я перейду к чтению аргументов Тайлера.
TylerRM @ 6.3.2015
Таким образом задача аналогична следующей.
В каком из двух решений дисперсия будет меньшей:
Взять 100$ сразу или 200$ с 50% частотой?
TylerRM @ 6.3.2015
Khishtaki, если я заменю тезис "дисперсия" на тезис "cреднеквадрати́ческое отклоне́ние", мое суждение будет верным?
Khishtaki @ 6.3.2015
ну что, убедил я тебя? Если да, то высылай, пожалуйста, штукарь Рави сразу, а насчёт Вити у тебя ещё есть шанс.
TylerRM @ 6.3.2015
Рассматриваем только ту линию игры (точнее группу линий), где оппонент совершает ошибки.
Допустим мы играем с оппонентом 2 раунда.
Банк равен 100 фишкам (для удобства подсчета).
В теории из 2 раз когда он сделал ошибку, оппонент должен был бы 1 раз ошибиться с колом ставки и 1 раз ошибиться с ставкой в чек.
С моей стратегией (во всех формулах сразу ставим сбалансированные велью + блефы, дальше велью, дальше чекаем велью):
В первом раунде мы выигрываем: 60%*100+20%*200+20%*100 = 60+40+20 = 120 фишек
Во втором раунде мы выигрываем: 60%*100+20%*100+20%*200 = 60+20+40 = 120 фишек
Со стратегией оппонента (рави):
В первом раунде мы выигрываем: 60%*100+40%*200 = 60+80 = 140 фишек
Во втором раунде мы выигрываем: 60%*100+40%*100 = 60+40 = 100 фишек
В теории оппонент ошибается равнозначно.
Значит в 25% случаях будет такой ран, где из двух раз он оба раза ошибется со ставкой в чек и ни разу с колом ставки.
Тут то мы с моей стратегией и покажем больший результат:
В первом раунде мы выиграем: 60%*100+20%*100+20%*200 = 60+40+20 = 120 фишек
Во втором раунде мы выигрываем: 60%*100+20%*100+20%*200 = 60+20+40 = 120 фишек
------------------------------------------------------------------
Суммарно 240 фишек
А стратегия Рави покажет больше:
В первом раунде: 60%*100+40%*100 = 100 фишек
Во втором раунде: 60%100+40%*100 = 100 фишек
------------------------------------------------------------------
Всего 200 фишек
Также естественно еще в 25% случаях будет ран, где оппонент два раза ошибется с колом ставки и ни разу со ставкой в чек.
Тут моя стратегия покажет по прежнему 240 фишек.
А стратегия Рави покажет:
В первом раунде 60%*100+40%*200 = 140 фишек
Во втором раунде 60%*100+40%*200 = 140 фишек
----------------------------------------------------------------
Суммарно 280 фишек
Еще в 50% случаях наши стратегии обе покажут по 240 фишек в ожидании.
В итоге график выигрышей в моей стратегии при ошибках оппонента будет ровно по диагонали (+120 фишек за каждый раунд) вверх.
График Рави будет зависет от того, насколько в определенном ране ему везло с ошибками оппонента. Если ему везло и оппонент выбирал благоприятную ему ошибку Рави получает 140 фишек за раунд, если не повезло то 100 фишек за раунд.
То есть его график будет вырываться сильнее вперед, если ему везло, и отставать от моего, если невезло.
Где это можно просто программно наглядно расчитать и вывести дисперсию и график отклонений от ожидаемого результата?