У меня в блоге некоторые комментаторы писали, что, дескать, 500игр еще не та дистанция, по которой можно делать выводы о ROI и плюсовости игрока. Интуитивно я с ними сразу же не согласился, потому что каждому человеку, который работал со статистическими данными, известно, что 500 наблюдений всегда достаточно для довольно точной оценки единственного параметра. А параметр у нас здесь и в самом деле один - винрейт, процент выигранных игр.
У меня нет задачи строить большую полную таблицу для различных количеств игр и различных ROI, где проверялись бы гипотезы о том, что A: игрок плюсовый, или В: игрок имеет ROI: 5%+, или C: игрок имеет ROI 10%+ и т.д., но кое-какие вычисления я сделал. Каждый для себя может для себя адаптировать вычисления по простой схеме. Для этого нужно знать 3 базовые вещи:
1. Распределение, когда результатом наблюдения является успех-неудача (выигрыш-проигрыш), называется биномиальным. где p - вероятность успеха, а q = 1 - p, вероятность неудачи. При этом нужно потребовать независимость наблюдений. Да, в случае покера с его "тильтом" и "пёром" это не совсем так, но все же зависимостью результатов игр друг от друга вполне можно пренебречь.
2. Известно, что стандартное отклонение при n наблюдениях для биномиально распределенной случайной величины равно sqrt(npq)
3. Известно, что при npq > 25 и 0.1 < p < 0.9 биномиальное распределение сходится к стандартному нормальному. У нас это выполнено с огромным запасом, благодаря ГСЧ, который никогда не дает винрейтов больше 90%, и большому числу игр.
Просто воспользуемся следующей формулой (она вытекает из теоремы Муавра-Лапласа, но это неважно ):
Здесь m - это реальное число наших побед-успехов, p - тестируемый, "предполагаемый" или граничный винрейт, Ф(*) - функция стандартного нормального распределения.
Раз уж в недостаточной дистанции уличали меня, то для начала посчитаю результаты для своей ХА-истории. 500 игр, винрейт 64%, что при рейке в 5% соответствует ROI = 21.90%. Я хочу проверить гипотезу о том, что мой винрейт больше p = 60.5%, что соответствует ROI >= 15.24%.
m = 64%*500 = 320 n = 500 p = 0.605 q = 0.395
Дробь получается равной 1.6468. Известно, что величина, подчиняющаяся стандартному нормальному распределению, принимает значение на отрезке от [-1.65 ; 1.65] в 90% случаев, то есть наш ROI с 95% вероятностью превосходит 15.24% и с 95% вероятностью не превышает 28.56%.
Итого для 500 игр 90%-ный доверительный интервал по ROI заключается в промежутке [15.24% ; 28.56%], а, соответственно, 90%-ный доверительный интервал по винрейтам [60.5% ; 67.5%]
Покажем, что, на самом деле, диапазон рабочего ROI сам по себе здесь не так важен и на размер 95%-ного доверительного интервала для конкретного n не влияет и размер этот для n=500 примерно равен 7%.
Задача: За 500 игр у игрока винрейт 57%, что соответствует ROI = 8.57% Является ли этот игрок плюсовым с вероятностью 95%?
Решение: Подставим в формулу известные значения m = 57% * 500 = 285 p = 0.525 (именно этот винрейт 52.5% может вывести игрока в ноль из-за рейка) n = 500
Итого дробь равна: 2.035, что еще больше значения 1.65, то есть игрок плюсов примерно с вероятностью 98%. А его винрейт с 90% вероятностью не отличается от текущего больше, чем на [1.65*sqrt(npq)-0.5]/n = 3.58%, то есть лежит в промежутке [53.42% ; 60.58%]. Заметим, что и в первом примере это значение разброса от текущего винрейта тоже было почти таким же, 3.5%
Итак, если вы сыграли 500игр неважно с каким винрейтом, то вы можете заключить, что ваш реальный винрейт с 90% вероятностью не отличается от него больше чем на 3.5%.
Я посчитал подобные "константы" и для других дистанций:
Вот что получилось:
50 игр 10.5% 100 игр 7.65% 150 игр 6.3% 200 игр 5.5% 250 игр 5.0% 300 игр 4.5% 400 игр 3.95% 500 игр 3.6% 600 игр 3.25% 700 игр 3% 800 игр 2.82% 900 игр 2.66% 1000 игр 2.53% 1250 игр 2.26% 1500 игр 2.07% 2000 игр 1.80% 3000 игр 1.47% 4000 игр 1.28% 5000 игр 1.14% 10000 игр 0.81%
Итак, если вы сыграли 10000 супертурбо по 1000$ с винрейтом 54%, то с 90%-ной вероятностью ваш винрейт заключен в промежутке от 53.19% до 54.81%.
Естественно, для таких вещей как супертурбо нужны более длинные дистанции, так как нас там не очень устроит знание, что мы имеем винрейт 55% плюс-минус 3.5%. Аналогично и для слабоплюсовых игроков в регулярных HU 1% винрейта может отделять катку в плюс или в минус. В супертурбо желательно винрейт знать с точностью до 1-1.5%.
Если вас не устраивают 90%-ные вероятности, а нужны аж 98%-ные, то можете умножить эти проценты на 1.41 и получите диапазон, из которого не уходит ваш винрейт с 98%-ной вероятностью.
Также я посчитал кое-что про возможные даунстрики на тех или иных дистанциях (самая больная и животрепещущая тема для игрока :)). Если интересно - опубликую здесь.
Сообщение отредактировал sentpim - 28.1.2011, 19:29
Цитата (Art_ru @ 29.1.2011) У меня есть отрезки: 100 игр с 30% роя (по твоим расчетам реальный должен быть 30+-7.65%), 300 игр с 0% роя (по твоим расчетам реальный должен быть 0+-4.5%), 500 игр с 1% роя (по твоим расчетам реальный должен быть 1+-3.6%) и куча других не попадающих в твой диапозон плюс-минус
но на огромной дистанции рой 13%, и это он реальный
Что на это скажешь математик? Что я всегда попадаю в 10% выборки? Так я тебе приведу ещё с десяток отрезков, а вероятность 10 раз попасть в 10% сам знаешь какая.
Твои расчеты до 1к турниров не имеют ничего общего с действительностью. Чтобы выяснить реальный рой нужно набить минимум 1к турниров, а если нужна точность то 5к штук.
Ты путаешь РОИ и винрейт. Эта таблица для колебаний винрейтов. Подробнее отвечу на вопрос в следующем посте, где расскажу про возможные даунстрики.
Цитата (AABC @ 29.1.2011) Сорри, а где в формуле отражена глубина стеков и уровни блайндов? В смысле, супертурбо там или дипы, или обычные турбо.
Я хочу сказать, что можно отыграть 500 СТ с "рои" 20%, который конечно же и близко не будет к реальному.
Глубина стеков влияет на винрейт: чем менее глубокие стеки, тем меньшего преимущества можно добиться над оппонентом и, следовательно, меньший РОИ теоретически можно иметь. Если РОИ мал, то нам нужно знать его с большей точностью, чтобы гарантированно понимать играем мы в плюс или в минус.
Про стрики я напишу чуть позже. Да, можно отыграть какие-то 500 супертурбо с РОИ 20%, но если ты будешь случайным образом выбирать дистанции по 500 турниров из своей истории в 10000 турниров, то подобные стрики будут происходить с вероятностью не более, чем в несколько процентов.
Цитата (AABC @ 29.1.2011) Допустим, я отыграл свои первые 500 СТ и попал в такой стрик. Сколько еще нужно сыграть, чтобы узнать истинный винрейт?(+/- n%)
Пока твой винрейт определен с точностью до 3.5%*1.41 с 98% вероятностью. Все уже написано ранее. Отыграй 2000, будет все гораздо точнее.
Цитата (PacT9i7a @ 2.2.2011) хм... сыграл 200 турниров . Разница между еv ajusted roi и о бычным roi 11% .
Ну учитесь же читать, я не про РОИ, а про ВИНРЕЙТЫ! 5.5% разница в винрейтах - это значительно больше, чем 11% разница в роях. Не говоря уж о том, что ХМ иногда криво считает аджастид РОИ.
Да и доверительные интервалы для вероятности успеха в Бернуллевских испытаниях просто строятся, уже давал ссылку в предудущей теме, вот она: http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval. Там только надо взять табличку квартилей нормального распределения - и вперед, считай, что угодно.
Вот про даунстрики интереснее, но там все зависит от того, как даунстрик определить :) иногда может нерешабельная задача получиться.
Да, я знал, что где-то такая табличка существует, но сколько раз ни пытался ее загуглить - не получалось.
Я помнил также твои темы, сейчас думаю насчет того как посчитать даунстрики с помощью твоей формулы, где ты вычислял вероятность получить стрик в N игр на той или иной дистанции. Пока мысли есть, но четкого осмысления нет. Тот способ, которым я изначально это хотел делать, неправильный.
(поясню для читателей: вот здесь: https://forum.gipsyteam.ru/index.php?viewtopic=1478Starik вычислил вероятность получить стрик в N игр на дистанции в M игр, причем формула не очень простая, рекурсивная, на калькуляторе это не посчитать, только на компе. Мне же хочется вычислить вероятность получить колебание в P байинов на дистанции в Q игр, более общая задача, потому что мы можем проиграть 10 раз, потом выиграть 3, а потом снова 7 раз проиграть).
Есть самый простой вариант - уподобиться покерному калькулятору и прогнать монте-карло 100500 раз, но хотелось бы как-то попроще, честно говоря) Есть еще вариант несколько упростить задачу: посчитать вероятность стрика в P байинов от начального Банкролла, но эта задача менее интересна, в принципе для ХА БРМ и так уже известен, а вот про локальные даунстрики - темный лес.
Цитата (Starik @ 2.2.2011) Можно, например, заняться вероятностью того, что в ноль мы выйдем только после N-ого турнира. Это тоже даунстрик ведь, или я не прав?
Ну, это смотря какой у человека РОИ. Для 90% игроков - это апстрик)
Пока я поставлю такую задачу: величина банкролла, который обеспечит на 99%-ную вероятность неразорения на той или иной дистанции при различных значениях рейка и собственного ROI игрока.
Цитата (N11F77 @ 13.4.2011) А для дипов какой хороший? 20% или чуть меньше?
Скажем так, 20%+ я видел только у двух человек на дипах за все время. Во многом из-за того, что сильные игроки не играют дипстеки, потому что регулярные, супертурбо и турбо выгоднее по доллар-в-час. 15% это все равно очень хорошо, даже 10% будет иметь только довольно солидный игрок, я б такого уважал. Я беру невысокие лимиты 10-30: на полтинниках и выше игры на дипах все равно почти нет.
Цитата (N11F77 @ 15.4.2011) Да в том то и дело, что интересует вообще возможный хороший результат на данном лимите, т.е. не теоретически если играть 10 столов с рои 15% а именно у реальных людей. И на какой дистанции $ в час можно смотреть? 500 игр нормально? речь всё про дипы. кстати, на сколько быстрее идут регулярные игры?
Дипы 3-3.5 в час, если играть 1 стол. Регулярные - 5 в час. В Дипах 15% отличный РОИ. В Регулярных 10-12%. Ну вот и считай. Если играть 2 стола, то РОИ упадет процента на 2-3.
Цитата (uofert @ 18.11.2011) sentpim, напиши пожалуйста формулу по которой ты перевёл винрейт в ROI
Пусть WR = WinRate = Win/N (измеряется в %), r = Rake/BI (измеряется в %), BI=buy-in, N - количество сыгранных турниров, Win - число побед, Rake - величина рейка в $, Prize_Pool - величина призового фонда в $, тогда
Это обобщенная формула для турниров, где 1 приз (то есть годится и для шутаутов на 4 человека и даже для сателлитов по доллару, где только 1 человек из 12000 выходит на ME WSOP). Разница только в том как выразить призовой фонд через величину бай-ина.
В случае хэдзап СНГ, где Prize_Pool = 2*BI формула такова:
ROI = [2WR/(1+r) - 1] * 100%
В случае шутаутов на 4 человека:
ROI = [4WR/(1+r) - 1] * 100%
Например, подставим в первую формулу рейк = 5% от бай-ина и винрейт 57%, то получим:
Цитата (uofert @ 19.11.2011) мне эта формула нужна, что бы более точно определять ROI хиро на определённой дистанции например хиро имеет ROI 40% на дистанции 2к турниров, вопрос, какое значение ROI будет иметь хиро на дистанции 50/100/200 турниров, известно что значение ROI будет сильно снижаться, при уменьшении кол-во турниров сейчас я приблизительно оцениваю ROI хиро на маленьких дистанциях, а точнее тупо отнимаю проценты, от значения ROI на длинной (достоверной) дистанции
Постановка вопроса, к сожалению, такова, что очевидно, что вы не очень понимаете тему и непонятно тогда зачем это вам нужно.
Если РОИ на дистанции 2К турниров х%, то самая правдоподобная оценка РОИ на дистанции в 100 турниров тоже х%. С чего оно должно снижаться - непонятно. То если есть какие-то штуки типа перебора по ЕВ. Но если есть перебор по ЕВ то в качестве оценки РОИ нужно взять ЕВ-РОИ.
Цитата (uofert @ 22.11.2011) поразмыслив снова на эту тему, я понял, что для получения достоверного ROI бэкера на определённой дистанции, нужно составлять математическую модель, учитывать ITM, попадания в малые, средние, большие призы - эти показатели брать с топ шарка или похожего сайта 1. можно составить мат модель по среднему игроку, 2. можно составлять мат модель для конкретного игрока - во втором случае ROI бэкера будет более точным, по сравнению с первым
Да, так можно сделать. В любом случае это будет аппроксимация, но если сделать достаточное количество пэй-зон, в которые попадает игрок, и правильно задать для него вероятности, то можно посчитать РОИ инвестора. Тут будет чуть более сложная полиномиальная модель (то есть исходов не 2 как в этом посте, а несколько), но ее можно обсчитать на компьютере. В общем это решаемая задача.
Цитата (uofert @ 22.11.2011) Вот нашёл на одном из форумов
Пример выйгрыша МЕ WSOP.
1) Один выйгрыш 8.000.000$ 2) 4 выйгрыша по 750.000$= 3.000.000$ 3) 10 раз по 200.000$=2.000.000$ 4) 20 раз по 75.000$=1.500.000% 5) 50 раз по 40.000$ = 2.000.000$ 6) 140 раз по 25000$= 3.500.000$
Инетересно на сколько достоверной можно считать эту модель
Эта "модель" настолько же достоверна как и написание слова "выигрыш" через Й.
Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
На каждой странице будет видно, где появились новые посты и комментарии.
Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.
У меня нет задачи строить большую полную таблицу для различных количеств игр и различных ROI, где проверялись бы гипотезы о том, что A: игрок плюсовый, или В: игрок имеет ROI: 5%+, или C: игрок имеет ROI 10%+ и т.д., но кое-какие вычисления я сделал. Каждый для себя может для себя адаптировать вычисления по простой схеме. Для этого нужно знать 3 базовые вещи:
1. Распределение, когда результатом наблюдения является успех-неудача (выигрыш-проигрыш), называется биномиальным. где p - вероятность успеха, а q = 1 - p, вероятность неудачи. При этом нужно потребовать независимость наблюдений. Да, в случае покера с его "тильтом" и "пёром" это не совсем так, но все же зависимостью результатов игр друг от друга вполне можно пренебречь.
2. Известно, что стандартное отклонение при n наблюдениях для биномиально распределенной случайной величины равно sqrt(npq)
3. Известно, что при npq > 25 и 0.1 < p < 0.9 биномиальное распределение сходится к стандартному нормальному. У нас это выполнено с огромным запасом, благодаря ГСЧ, который никогда не дает винрейтов больше 90%, и большому числу игр.
Просто воспользуемся следующей формулой (она вытекает из теоремы Муавра-Лапласа, но это неважно ):
Здесь m - это реальное число наших побед-успехов, p - тестируемый, "предполагаемый" или граничный винрейт, Ф(*) - функция стандартного нормального распределения.
Раз уж в недостаточной дистанции уличали меня, то для начала посчитаю результаты для своей ХА-истории. 500 игр, винрейт 64%, что при рейке в 5% соответствует ROI = 21.90%. Я хочу проверить гипотезу о том, что мой винрейт больше p = 60.5%, что соответствует ROI >= 15.24%.
m = 64%*500 = 320
n = 500
p = 0.605
q = 0.395
Дробь получается равной 1.6468. Известно, что величина, подчиняющаяся стандартному нормальному распределению, принимает значение на отрезке от [-1.65 ; 1.65] в 90% случаев, то есть наш ROI с 95% вероятностью превосходит 15.24% и с 95% вероятностью не превышает 28.56%.
Итого для 500 игр 90%-ный доверительный интервал по ROI заключается в промежутке [15.24% ; 28.56%], а, соответственно, 90%-ный доверительный интервал по винрейтам [60.5% ; 67.5%]
Покажем, что, на самом деле, диапазон рабочего ROI сам по себе здесь не так важен и на размер 95%-ного доверительного интервала для конкретного n не влияет и размер этот для n=500 примерно равен 7%.
Задача:
За 500 игр у игрока винрейт 57%, что соответствует ROI = 8.57% Является ли этот игрок плюсовым с вероятностью 95%?
Решение:
Подставим в формулу известные значения
m = 57% * 500 = 285
p = 0.525 (именно этот винрейт 52.5% может вывести игрока в ноль из-за рейка)
n = 500
Итого дробь равна: 2.035, что еще больше значения 1.65, то есть игрок плюсов примерно с вероятностью 98%. А его винрейт с 90% вероятностью не отличается от текущего больше, чем на [1.65*sqrt(npq)-0.5]/n = 3.58%, то есть лежит в промежутке [53.42% ; 60.58%]. Заметим, что и в первом примере это значение разброса от текущего винрейта тоже было почти таким же, 3.5%
Итак, если вы сыграли 500игр неважно с каким винрейтом, то вы можете заключить, что ваш реальный винрейт с 90% вероятностью не отличается от него больше чем на 3.5%.
Я посчитал подобные "константы" и для других дистанций:
Вот что получилось:
50 игр 10.5%
100 игр 7.65%
150 игр 6.3%
200 игр 5.5%
250 игр 5.0%
300 игр 4.5%
400 игр 3.95%
500 игр 3.6%
600 игр 3.25%
700 игр 3%
800 игр 2.82%
900 игр 2.66%
1000 игр 2.53%
1250 игр 2.26%
1500 игр 2.07%
2000 игр 1.80%
3000 игр 1.47%
4000 игр 1.28%
5000 игр 1.14%
10000 игр 0.81%
Итак, если вы сыграли 10000 супертурбо по 1000$ с винрейтом 54%, то с 90%-ной вероятностью ваш винрейт заключен в промежутке от 53.19% до 54.81%.
Естественно, для таких вещей как супертурбо нужны более длинные дистанции, так как нас там не очень устроит знание, что мы имеем винрейт 55% плюс-минус 3.5%. Аналогично и для слабоплюсовых игроков в регулярных HU 1% винрейта может отделять катку в плюс или в минус. В супертурбо желательно винрейт знать с точностью до 1-1.5%.
Если вас не устраивают 90%-ные вероятности, а нужны аж 98%-ные, то можете умножить эти проценты на 1.41 и получите диапазон, из которого не уходит ваш винрейт с 98%-ной вероятностью.
Также я посчитал кое-что про возможные даунстрики на тех или иных дистанциях (самая больная и животрепещущая тема для игрока :)). Если интересно - опубликую здесь.