Konnogonn @ 8.7.2017
Таня, так какой же ответ? Как его можно получить у Вас?
gambler2502 @ 8.7.2017
И несклолько десятков ставок это, без сомнения, значимая статистическая выборка!
Попробую дать ответ сразу на два вопроса (в цитатах) от двух разных участников.
Сначала напомню предисторию. В теме "Big Odds on PinnacleSports" автор (неосторожно) написал о своих ставках на форы вместо побед: "Как-то пробовал на небольшом отрезке в несколько десятков ставок, была околонулевая тыканина - плюнул и решил чистые победы ставить. Думаю, как вы и предположили, что в чистых победах валуя действительно больше." Я, проходя мимо, написала в ответ свое: "Для проверки нужно несколько тысяч. Я проверяла. Результаты разные, зависят от вида спорта и рынка в нем". После чего ко мне, в мою тему "Право на модерацию" явился разъяренный участник (не автор!) и начал громко возмущаться моей наглостью, моим тоном и т.п.
Если отбросить недержание эмоций (хотя это тоже очень важный вопрос), то суть дела состоит в следующем:насколько значима выборка в десятки ставок, почему я говорю, что это ничтожная выборка, почему я утверждаю, что нужны тысячи?
Прежде всего, надо сделать ясную постановку задачи. А то может оказаться, что автор имел ввиду одно, я другое, а спрашивающие здесь третье. Так вот, я приняла за исходное такое: автор написал, что результат нескольких десятков ставок на форы, которые показали околонулевые результаты, дает ему основание отвергнуть гипотезу о том, что ставки на форы лучше ставок на победы (эту гипотезу выдвинул там другой участник, в виде вопроса).
Проверка гипотез - это стандартная процедура (точнее, процедуры) теории вероятностей. Соответствующий ее раздел так и называется. По определенным правилам на основании имеющихся данных вычисляются некоторые числа (критерии) и в зависимости от их величины гипотезу либо принимают, либо отвергают.
При этом, однако, есть один прикольный момент: выносится не точное суждение, а суждение с определенной точностью, цитирую: "Важно понимать, что при проверке гипотез мы работаем с данными выборки. Поэтому наши суждения на основе результатов проверки гипотез всегда имеют вероятностный характер. Какое бы решение мы не приняли, всегда существует возможность ошибки принятия этого решения". Ошибки бывают первого рода и второго рода. Первого рода - это когда мы ошибочно отвергаем истину. Второго рода - это когда мы ошибочно принимаем за истину ложь.
Здесь я резко уйду от учебников. Чтобы проще все показать. На нашем конкретном примере с форами.
Сначала строим модель. Обычно форы делаются для равенства шансов, т.е. 50 на 50. И коэффициент С был бы 2, но с учетом маржи его делают, к примеру, 1.98. Пусть такое значение коэффициента будет у нас для всех игр. У нас имеется также некий алгоритм, по которому мы выбираем не все ставки, а только некоторые, предполагая, что там вероятность исхода Р не 0,5 а выше, достаточно выше, чтобы перебить маржу и дать, к примеру, 10% прибыли. Т.е. С*Р - 1 = 0.1; раз С = 1.98, то Р = (1 + 0,1)/1.98 = 0.56. Все модель готова. Теперь правильно ставим вопрос: вот у нас 10% плюсовая модель (мы сами ее сделали, как отражение реальной ситуации), но на конечной дистанции всякое может быть, это на бесконечной дистанции будет 10% - какова же вероятность, что на дистанции в 50 ставок (несколько десятков ставок) наша плюсовая стратегия даст профит ниже нуля, т.е. будет выглядеть, как проигрышная? Так как модель простая, то ее просто прогнать на компе и получить ответ: 25%. Этого плохо. Обычно на практике все хотят иметь "очки" с погрешностью в проценты (1-2%), а не десятки процентов. Для 500 ставок "зрение" значительно улучшается: 3%. Но и этого, как видно, мало для достижения стандартных норм. Таким образом, при нескольких десятках ставок у нас аномально большая вероятность совершить ошибку первого рода, т.е. отвергнуть плюсовую стратегию.
Сделаем все то же, построив заведомо проигрышную модель. Т.е. предположив, что наш алгоритм дает -10% профита. Для чего в модели достаточно поменять Р на 0.45. И опять правильно ставим вопрос: вот у нас -10% минусовая модель (мы сами ее сделали, как отражение реальной ситуации), но на конечной дистанции всякое может быть, это на бесконечной дистанции будет -10% - какова же вероятность, что на дистанции в 50 ставок (несколько десятков ставок) наша минусовая стратегия даст профит выше нуля, т.е. будет выглядеть, как выигрышная? Получаем ответ: 21%. Для 300 ставок - 2%. Т.е. хотя "зрение" на предмет ошибок второго рода (принять провальное за плюсовое) улучшается быстрее, чем для ошибок первого рода, все равно на нескольких десятках ставок оно не годится для вынесения решений.
Я писала, что нужны выборки из тысяч. А здесь вроде как сотни годятся. Но я ориентировалась на 5% профита, как по мне, это более реалистично на дистанции. Так вот, если взять 5% профита и повторить наши модели на предмет ошибок первого и второго рода, то получаем: для 50 ставок - 39% и 33%, для 500 ставок - 20% и 7%, для 1000 ставок - 9% и 3%.
Вот и все. Нравится или не нравится, но только статистикой, только достаточным количеством испытаний можно отделить истину от лжи. Это количество можно взять из формул или прямо из прогона моделей. Но никак не из обыденного мнения, "здравого смысла" и т.п.
Ну зачем же так открыто подставлять себя)) Вдруг кто-то скопирует и растрезвонит: "Капитан и Его команда занимаются откровенным надувательством! Сами признаются!"
Действительно, многие (до поры, до времени) не задумываются о роли науки в вопросах истинности. Но почти все занимаются подсчетами своих доходов)