Колодец Ивана Демидова

Последний пост:13.09.2023
572
Статистика
Всего постов
10285
2,832,997 просмотров
Новых постов
+0
2 в день
Лучшие посты автора
03.02.2017 +373
01.01.2016 +269
24.04.2014 +239
09.01.2015 +230
13.07.2016 +197
Лучшие посты читателей
Zaya +286
Khishtaki +195
ilushan +174
ph0 +172
ConstOr +171
Самые активные читатели
Lika 165
Khishtaki 127
Nameless00 126
ilushan 106
rezzo 101
1 379 399 400 401 402 421 515
  • А есть кто-то на форуме, кто хорошо шарит в тер. вере и статистике? Не могу понять очевидную вещь про доверительный интервалы. С одной стороны пишут, что

    It is an observed interval (i.e., it is calculated from the observations), in principle different from sample to sample, that potentially includes the unobservable true parameter of interest. How frequently the observed interval contains the true parameter if the experiment is repeated is called the confidence level. In other words, if confidence intervals are constructed in separate experiments on the same population following the same process, the proportion of such intervals that contain the true value of the parameter will match the given confidence level.


    а с другой



    Confidence intervals are frequently misunderstood, and published studies have shown that even professional scientists often misinterpret them.[7][8][9][10]
    A 95% confidence interval does not mean that for a given realised interval calculated from sample data there is a 95% probability the population parameter lies within the interval.[11] Once an experiment is done and an interval calculated, this interval either covers the parameter value or it does not; it is no longer a matter of probability. The 95% probability relates to the reliability of the estimation procedure, not to a specific calculated interval.[12] Neyman himself (the original proponent of confidence intervals) made this point in his original paper:[3]


    А в чем разница? Взято отсюда.
    2408/3008
    Ответить Цитировать
    1
  • Смотри: пусть матожидание монетки (случайная величина X) равно 0,5, но мы его не знаем. Мы бросаем монетку 625 раз и считаем Y - долю решек . Сигма будет равна 0,25 / корень из 625 = 0,01. Если я правильно помню, доверительный интервал для 90% составляет 2 сигма, т.е. 90-% доверительный интервал равен [Y-0.02; Y+0.02].

    Что это значит? Что в 90% случаев Y окажется таким, что матожидание X действительно попадёт в этот интервал. Но представь, что случился выброс дисперсии и Y оказался равен 0,45. Мы получили интервал [0.43; 0.47]. Можно ли сказать, что матожидание лежит в этом интервале с вероятностью 90%? Нельзя. Оно просто вне этого интервала и всё.

    Иными словами 90% - это не вероятность того, что матожидание будет в интервале [0,43; 0.45] (после того, как мы уже вычислили интервал), а вероятность того, что интервал "накроет" точку 0.5 (до того, как мы его вычислили).
    12/73
    Ответить Цитировать
    2
  • БоевойСлон, Так блин. В чем разница то? Мне всегда казалось, что если мы говорим, что точка попадает в такой-то интервал с такой-то вероятностью, то это значит, что по результатам эксперимента она либо попала, либо нет. И что если мы проведем дофига экспериментов и разделим "попала" на число экспериментов, то эту самую вероятность мы и получим. Где я туплю?

    Можешь просто дать определение: "вероятность того, что матожидание будет в интервале"?
    Сообщение отредактировал Soul - 16.1.2017, 23:29
    2409/3008
    Ответить Цитировать
    0
  • а можно вопрос на русском языке(без английского) сформулировать?
    8/16
    Ответить Цитировать
    0
  • Представь, что у тебя есть много монеток с неизвестными вероятностями решки. Ты выбрал монетку, сделал 625 бросков и получил [0,43; 0.47].

    Фраза из ошибочной формулировки "for a given realised interval calculated from sample data there is a 90% probability the population parameter lies within the interval" в данном случае может привести к выводу, что для 90% твоих монеток вероятность решки лежит в этом интервале. А это ошибочный вывод.

    Или вот так ещё. Представь, что существует способ определить матожидание точно, путём физического обмера монетки. Если мы получили интервал [0,43; 0,47], то это НЕ значит, что мы можем поставить 9 к 1 на то, что в результате физического обмера этой монетки получится число из этого интервала.
    Сообщение отредактировал БоевойСлон - 17.1.2017, 0:22
    13/73
    Ответить Цитировать
    0
  • Quote (БоевойСлон @ 16.1.2017)
    в данном случае может привести к выводу, что для 90% твоих монеток вероятность решки лежит в этом интервале.


    Там вроде речь про другое в английском тексте.

    Quote (БоевойСлон @ 16.1.2017)
    Или вот так ещё. Представь, что существует способ определить матожидание точно, путём физического обмера монетки. Если мы получили интервал [0,43; 0,47], то это НЕ значит, что мы можем поставить 9 к 1 на то, что в результате физического обмера этой мометки получится число из этого интервала.


    Почему?
    2410/3008
    Ответить Цитировать
    0
  • Quote (vitja11111 @ 16.1.2017)
    а можно вопрос на русском языке(без английского) сформулировать?


    Боюсь, что при переводе потеряю что-то важное. Примерный перевод говорит, что 90% доверительный интервал не означает, что вероятность параметра попасть в этот интервал равна 90%.
    2411/3008
    Ответить Цитировать
    0
  • Хотя бы потому, что мы при этом не учитываем априорное распределение монеток.

    Давай вот так ещё попробую объяснить различие.

    Возьмём фразу: "Вероятность того, что матожидание монетки будет лежать в интервале Y-0.02; Y+0.02", равна 90% . Смысл этой фразы в том, что от эксперимента к эксперименту будет меняться Y. И для честной монетки с вероятностью 90% Y будет получаться в промежутке от 0.48 до 0.52. Будет меняться сам интервал.

    А теперь возьмём фразу: "Вероятность того, что матожидание монетки лежит в интервале [0,43; 0.47], равна 90%". Эта фраза фиксирует интервал. Он больше не меняется. Эта фраза математически бессмысленна, поскольку больше нет источника случайности (у нас фиксированная монета и фиксированный интервал), а значит нет и вероятности.

    При этом поскольку интервал эта фраза фиксирует явно, а монетку - нет, существует опасность приписать источник случайности самой монетке и решить что это 90% монеток имеют матожидание в этом интервале. Особенно если мы бросали разные монеты, а не одну и ту же.
    Сообщение отредактировал БоевойСлон - 17.1.2017, 0:51
    14/73
    Ответить Цитировать
    2
  • БоевойСлон, У меня была такая версия, но похоже, что нет. Вот тут example 5 есть такое примечание в конце

    A word of caution: it is tempting and common, but wrong, to think that there is a 95%
    probability the true fraction p0 is in the confidence interval. This is subtle, but the error
    is the same one as thinking you have a disease if a 95% accurate test comes back positive.
    It’s true that 95% of people taking the test get the correct result. It’s not necessarily true
    that 95% of positive tests are correct.


    Если бы фраза была бессмысленна, то так бы и написали наверное?
    2412/3008
    Ответить Цитировать
    0
  • Во, придумал как точно сформулировать эксперимент, в котором легко совершить такую ошибку.

    Пусть у нас много монеток, и каждую мы бросили по 100 раз. Потом выбрали те монетки, для которых решка выпала ровно 45 раз. Затем построили 95% доверительный интервал для для результата 45 решек из 100. И сказали, что 95% из выбранных монеток имеют матожидание решки в этом интервале. Это будет ошибочным выводом.
    15/73
    Ответить Цитировать
    2
  • Цитата (Soul @ 16.1.2017)
    Если бы фраза была бессмысленна, то так бы и написали наверное?

    Ну почему же, они как раз и придают ей такой смысл, о котором я говорю: что 95% людей (монеток) с положительным результатом больны (имеют МО в данном интервале).

    Т.е. незаметно подменяется источник случайности: вместо разных результатов теста для одного и того же человека начинают говорить о разных людях с одним и тем же результатом теста.
    16/73
    Ответить Цитировать
    1
  • Quote (БоевойСлон @ 16.1.2017)
    Во, придумал как точно сформулировать эксперимент, в котором легко совершить такую ошибку.

    Пусть у нас много монеток, и каждую мы бросили по 100 раз. Потом выбрали те монетки, для которых решка выпала ровно 45 раз. Затем построили 95% доверительный интервал для для результата 45 решек из 100. И сказали, что 95% из выбранных монеток имеют матожидание решки в этом интервале. Это будет ошибочным выводом.


    Нет. В твоем примере это не будет доверительный интервал. Нельзя ничего выкидывать и выбирать.

    Quote (БоевойСлон @ 16.1.2017)
    Ну почему же, они как раз и придают ей такой смысл, о котором я говорю: что 95% людей (монеток) с положительным результатом больны (имеют МО в данном интервале).

    Т.е. незаметно подменяется источник случайности: вместо разных результатов теста для одного и того же человека начинают говорить о разных людях с одним и тем же результатом теста.


    Это все хорошо, но я так и не понял, почему вероятность того, что реальное значение параметра попадет в этот интервал не равно 90 или 95.
    2413/3008
    Ответить Цитировать
    1
  • есть случайная величина
    мы взяли выборку ее значений
    по выборке построили доверительный интервал с уровнем доверия 0.9

    концы интервала зависят от выборки

    во втором фрагменте написано
    что для каждой выборки это будет один интервал(он может быть разным для разных выборок )
    который либо покроет параметр или нет

    но для 90% выборок покроет

    ихмо
    9/16
    Ответить Цитировать
    0
  • vitja11111, Ну так и я про то. Для каждой выборки интервал будет свой - это понятно. На дистанции в 90% таких интервалов будет лежать истинное значение параметра. Дальше мы берем какую-то одну выборку, строим интервал. Почему нельзя сказать, что вероятность того, что параметр лежит в нем = 90%? Тут есть какая-то очевидная логика, но от меня она ускользает.
    2414/3008
    Ответить Цитировать
    0
  • Цитата (Soul @ 16.1.2017)
    How frequently the observed interval contains the true parameter if the experiment is repeated is called the confidence level.


    Цитата (Soul @ 16.1.2017)
    for a given realised interval calculated from sample data there is a 95% probability the population parameter lies within the interval.


    Вторая фраза фиксирует интервал аналогично фразе "С вероятностью 90% матожидание лежит в интервале [0.43; 0.45]". Дальше её можно счесть математически бессмысленной, как это делается в этом тексте: "Once an experiment is done and an interval calculated, this interval either covers the parameter value or it does not; it is no longer a matter of probability."

    А можно интепретировать её как ложное утверждение, как это делается в твоей последней цитате: "the error is the same one as thinking you have a disease if a 95% accurate test comes back positive"

    Наконец, можно решить, что вторая фраза имеет тот же смысл, что и первая, но это будет означать, что
    Цитата (Soul @ 16.1.2017)
    при переводе потеряю что-то важное

    Потому что выделенные мной слова "given realised" придают фразе совсем другой смысл. В первой фразе "observed interval" полагается случайной величиной, а во второй - фиксируется.
    17/73
    Ответить Цитировать
    0
  • изначально у нас есть случайная величина с параметром М который хотим оценить

    в конце есть интервал на котором это число либо лежит либо нет

    М это число поэтому на интервале либо лежит либо нет я так понял
    10/16
    Ответить Цитировать
    0
  • БоевойСлон, От перемены слов понятнее не становится. Если монетка, мы ее кидаем. Получили выборку. Построили интервал (один). Можем ли мы сказать, что с вероятностью 90 или 95% мы получим интервал, содержащий 0.5? Вроде бы да. Короче я запутался.
    2415/3008
    Ответить Цитировать
    0
  • да с вероятностью 0.9 получим интервал содержащий число 0.5
    11/16
    Ответить Цитировать
    0
  • но это будет конкретный интервал и число 0.5 на нем либо содержится либо нет
    12/16
    Ответить Цитировать
    0
  • поэтому вероятность нахождения числа 0.5 на этом конкретном интервале 0 или 1
    13/16
    Ответить Цитировать
    0
1 379 399 400 401 402 421 515
1 человек читает эту тему (1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.