Комментарии к колодцу Феруэлла

823
Статистика
Статистика
823
  • 500+
    подписчиков
  • 10M+
    просмотров
В этой теме обсуждаются посты из колодца Феруэлла.
Если вы хотите задать ему новый вопрос, напишите его в колодце
Статистика темы
  • Популярность
    Топ-53
  • Постов
    49,954
  • Просмотров
    12,908,813
  • Подписок
    823
  • Карма автора
    +26,465
1 2380 2381 2382 2383 2498
  • barbeysize @ 19.3.2018
    https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3478593/


    Хорошая статья

    It is imperative to emphasize that the shape of the fingerprints in Fig. 1 will deviate from pure 2-d Gaussian distributions as a result of nonfraudulent mechanisms as well because of heterogeneity in the population. The purpose of the parametric model is to quantify to which extent ballot stuffing and the mechanism of extreme fraud may have contributed to these deviations or if their influence can be ruled out on the basis of the data.

    Но в записке Андрея Курпатова мы видим: "о, Гауссиана, о, отклонение от неё, о вбросы", т.е. нет никакой попытки оценить, какой вклад в отклонение внесло "heterogeneity in the population", а какой "ballot stuffing", и всё, что не укладывается в гауссиану записано в "ballot stuffing".
    Ответить Цитировать
    182/220
    + 0
  • Soul @ 19.3.2018
    eST, Ну только "эта" модель работает.


    Только вот она не работает. В том числе в статье, которую привёл barbeysize, тоже сказано, что отличия от 2d гауссианы могут быть весьма значительными, и в таких случаях надо моделировать распределение другими способами.

    Soul @ 19.3.2018
    Нет ни одной реалистичной причины, почему в условной Ярославской области не будет Гаусианны.


    А причина разделения на городское и сельское население уже не рассматривается? Или на то, что разные районы могут иметь совершенно разных жителей? Или что жители района вокруг университета будут сильно отличаться от жителей района вокруг завода?
    Ответить Цитировать
    183/220
    + -1
  • будешь объяснять "∼100% turnout/∼100% of votes for the winning party" через "heterogeneity in the population" и/или требовать доказательств? серьезно? ты хороший демагог - ты точно можешь лучше.

    на прошлых выборах этого не было, а на этих есть - наблюдатели в чечне. где наблюдателей нет, там 99/99. где есть - там обыденность со средней явкой. вот и вся гетерогенность, имеющая 100% корреляцию с наличием наблюдения.
    Ответить Цитировать
    429/505
    + 1
  • barbeysize @ 19.3.2018
    это может быть не точный гаусс, но качественно распределение такого типа - шляпа с хвостами. конкретные величины или точная форма значения не имеют.


    О! Отлично, уже прогресс. Т.е. может быть и не точный гаусс, может быть и мультимодальное распределение (шляпа с хвостиками), а точная форма уже не имеет значения. И зачем было так вначале грубо разговаривать, если через несколько сообщений сам признал, что может быть что угодно, а не только гаусс?

    barbeysize @ 19.3.2018
    а вот наличие "large number of territorial units (thousands) with ∼100% turnout and at the same time, ∼100% of votes for the winning party" дает практический точный ответ на вопрос, что происходит.


    А вот это уже статистически смешное утверждение. thousands - это много или мало? А почему это много или мало? Может быть это зависит в том числе и от total number of territorial units? А какой процент от total number of territorial units много? А какой мало?
    Особенно это интересно звучит от покериста, для которых "выброс диспы" - это то, с чем он постоянно сталкивается. Вот, например, возьмём Чечню с её 90% за Путина и 90% явкой. Учтём, что там куча мелких участков (кишлаки, аулы, родовые поселения и тд). Сколько там будет участков со 100% явкой и 100% голосами за Путина чисто по теории вероятностей?
    Ответить Цитировать
    184/220
    + 0
  • barbeysize @ 19.3.2018
    будешь объяснять "∼100% turnout/∼100% of votes for the winning party" через "heterogeneity in the population" и/или требовать доказательств? серьезно? ты хороший демагог - ты точно можешь лучше.


    Зачем? От гауссианы ты уже открестился в пользу "шляпы с хвостиками" (надо же, священный гаусс повержен). По этому показателю ты не привёл ни одной цифры, а также не приведён способ из этого показателя расчёта объёма вбросов. С точки зрения статистики здесь нечего опровергать или доказывать.
    Ответить Цитировать
    185/220
    + 0
  • ни на каких реальных участках без подтасовок и нарушений не будет 100% явки со 100% голосами за путина. ни в городе, ни в кишлаке, ни у-ауле, ни на зоне, ни в военной части.

    тем более, что любой статистический анализ не может дать 100% точности и гарантии, а является только косвенным доказательством. поэтому, для полноты картины параллельно с разговорами о гауссе\не гауссе приводятся реальные доказательства реальных вбросов, каруселей, переписываний итоговых протоколов и т.д.

    в любом случае, любые реальные неоднородности, размазанности шляпы, увеличения или уменьшения хвостов или дополнительные пики должны быть принципиально объяснимы, причем чем более явное и резкое отклонение от схемы с одним горбом, тем более простым ("явным") должно быть объяснение.

    вот, например, на этой картинке:


    есть канада, вкоторой явка по стране примерно одинаковая, но есть две явные категории участков, на которых победитель показал два принципиально разных результата. это та самая региональность, про которую писал соул. причем тут очевиден не только сам факт региональности, но и виден электоральный масштаб этих регионов.

    есть польша, в которой нет всеобщей поддержки партии, но нет и деления на "враждующие" части - скорее много более мелких регионов с совершенно разной поддержкой разных партий, в т.ч. и "правящей"

    и есть руганда с ее 100/100 участками. давай, объясняй, что это за звери такие. я подожду.
    Сообщение отредактировал barbeysize - 19.3.2018, 18:47
    Ответить Цитировать
    430/505
    + 5
  • Омг @ 19.3.2018
    Неплохой прогноз.


    Скромно.
    Но они даже с помощью угроз увольнений и цветных карандашей не смогли добиться явки 70%. Пришлось рисовать 76,66% «за», чтобы отпраздновать 51% от общего числа избирателей. А так бы 74 и было.

    Три утренних шестёрки вышли очень символично. В итоговых такого быть не должно.
    Ответить Цитировать
    482/605
    + 3
  • barbeysize @ 19.3.2018
    тем более, что любой статистический анализ не может дать 100% точности и гарантии, а является только косвенным доказательством.


    Отлично! Я прям вижу развитие человека:
    Стадия первая. С матами и цифрами: вброшено 9.9 миллионов бюллетеней! Хотя бы доверительные интервалы для оценки посчитали, чтобы совсем смешно не выглядело.
    Стадия вторая. Гауссиана - единственный способ моделирования. Срочно ищем статьи по этой теме.
    Стадия третья. Ну, может быть и не гауссиана, а мультимодальное распределение в виде "шляпы с хвостиками".
    Стадия четвёртая. А что ты скажешь про А/B (а делить на бэ)? Какие будут доказательства? Хотя бы привёл А и Б для уважения к числам.
    Стадия пятая. Ну, статистический анализ - это только косвенное доказательство....
    Удачи!

    P.S. Картинка-то из статьи за 2012 год. Имей уважение к статистке. Если анализируешь выборы 2018, то хотя бы приводи данные по выборам 2018 года.
    Ответить Цитировать
    186/220
    + 2
  • перепост
    barbeysize @ 19.3.2018
    ни на каких реальных участках без подтасовок и нарушений не будет 100% явки со 100% голосами за путина. ни в городе, ни в кишлаке, ни у-ауле, ни на зоне, ни в военной части.

    тем более, что любой статистический анализ не может дать 100% точности и гарантии, а является только косвенным доказательством. поэтому, для полноты картины параллельно с разговорами о гауссе\не гауссе приводятся реальные доказательства реальных вбросов, каруселей, переписываний итоговых протоколов и т.д.

    в любом случае, любые реальные неоднородности, размазанности шляпы, увеличения или уменьшения хвостов или дополнительные пики должны быть принципиально объяснимы, причем чем более явное и резкое отклонение от схемы с одним горбом, тем более простым ("явным") должно быть объяснение.

    вот, например, на этой картинке:


    есть канада, вкоторой явка по стране примерно одинаковая, но есть две явные категории участков, на которых победитель показал два принципиально разных результата. это та самая региональность, про которую писал соул. причем тут очевиден не только сам факт региональности, но и виден электоральный масштаб этих регионов.

    есть польша, в которой нет всеобщей поддержки партии, но нет и деления на "враждующие" части - скорее много более мелких регионов с совершенно разной поддержкой разных партий, в т.ч. и "правящей"

    и есть руганда с ее 100/100 участками. давай, объясняй, что это за звери такие. я подожду.

    Ответить Цитировать
    431/505
    + 0
  • eST @ 19.3.2018
    Стадия первая. С матами и цифрами: вброшено 9.9 миллионов бюллетеней! Хотя бы доверительные интервалы для оценки посчитали, чтобы совсем смешно не выглядело.
    Стадия вторая. Гауссиана - единственный способ моделирования. Срочно ищем статьи по этой теме.
    Стадия третья. Ну, может быть и не гауссиана, а мультимодальное распределение в виде "шляпы с хвостиками".

    от первого я не отказалася. второго я не говорил. шляпа с хвостами по моей терминологии это и есть гаусс или любое гауссоподобное распределение.

    eST @ 19.3.2018
    Стадия пятая. Ну, статистический анализ - это только косвенное доказательство....

    довольно очевидно, что я это предполагал изначально и перманентно. статистика это штрих к картине фальсификаций.

    eST @ 19.3.2018
    Картинка-то из статьи за 2012 год. Имей уважение к статистке. Если анализируешь выборы 2018, то хотя бы приводи данные по выборам 2018 года.

    ты перепутал. я не брался тебе что-то доказывать про какие-то конкретные выборы. я только написал аргументы для порядка.

    любой адекватный и заинтересованный человек прочитает и по твоей ссылке на руксперт со "ссылками на литературу" в виде "независимой газеты", и по моей, и сам загуглит. и решит кто есть кто и что происходит.
    Ответить Цитировать
    432/505
    + 0
  • barbeysize @ 19.3.2018
    в любом случае, любые реальные неоднородности, размазанности шляпы, увеличения или уменьшения хвостов или дополнительные пики должны быть принципиально объяснимы, причем чем более явное и резкое отклонение от схемы с одним горбом, тем более простым ("явным") должно быть объяснение.


    Это просто новое слово в статистической науке: давайте сделаем хреновую модель, которая не работает. Объясним неработающую модель вбросами, и пусть другие явно объясняют эти аномалии. Нет, батенька, это наоборот разработчик модели доказывает, что аномалии - вбросы. А мы лишь можем сказать, что если кто-то моделирует явно не i.i.d RVs с помощью одной гауссианы и у него ничего не получается, то модель - отстой.

    barbeysize @ 19.3.2018
    и есть руганда с ее 100/100 участками. давай, объясняй, что это за звери такие. я подожду.


    Это тоже новое слово в статистической науке: привести данные за 2012 год в качестве доказательства вбросов выборов 2018 года. И потребовать у других объяснений.

    Вроде бы ты даже по правильному пути шёл. Отказался от гауссианы. понял, что моделирование не даёт 100% точности. Надо двигаться в сторону хорошей модели и построения доверительных интервалов, а ты скатываешься непонятно куда.
    Ответить Цитировать
    187/220
    + -1
  • barbeysize @ 19.3.2018
    шляпа с хвостами по моей терминологии это и есть гаусс или любое гауссоподобное распределение.


    Может тебе уже пора статью написать? Можно сразу в Nature (или куда там новые открытия и термины пишут?).
    Ответить Цитировать
    188/220
    + -4
  • eST @ 19.3.2018
    Это просто новое слово в статистической науке: давайте сделаем хреновую модель, которая не работает. Объясним неработающую модель вбросами, и пусть другие явно объясняют эти аномалии.

    при чем тут модели вообще? есть реальное распределенные реальных результатов. от тебя требуется объяснить эти реальный результаты. какова природа участков с предельной явкой и предельным результатом кандидата.

    eST @ 19.3.2018
    привести данные за 2012 год в качестве доказательства вбросов выборов 2018 года.

    опять бред. и те фальсификации, и эти доказаны или будут доказаны очевидными средствами. результаты за 12 год я привожу, потому что они уже проанализированы в большей степени, чем полученные сегодня с утра. при этом общий характер подтасовок от выборов к выборам, как и механизмы, по которым они производятся, естественно, от выборов к выборам не меняются. в этой и в других статьях предложено объяснение такого характера распределения - вбросы на отдельных участках. от тебя требуется альтернативное правдоподобное объяснение конкретных результатов на конкретных участках. математические модели оставь в покое.
    Ответить Цитировать
    433/505
    + 1
  • Стоит признать, что Навальный потерпел крупнейшее поражение в карьере. Ну почему нельзя было снова применить его гениальную тактику "голосуй за любую партию, кроме..."? Надеюсь он оправится и будет бороться дальше.
    Ответить Цитировать
    180/201
    + -15
  • модель (или реальное распределение) с одни пиком (румыния, испания, франция, чехия) говорит об одном общем характере всех участков (с незначительными/редкими отклонениями). модель (или реальное распределение) с несколькими выраженными и/или размазанными пиками (канада, польша, уганда, россия) говорит о разных характерах разных явно или неявно выраженных групп участков. моя версия - разный характер групп участков в канаде и польше объясняется региональностью, а в уганде и россии наличием и масштабами фальсификаций.

    твой вариант объяснения, eST?
    Ответить Цитировать
    434/505
    + 0
  • alexan @ 19.3.2018
    Стоит признать, что Навальный потерпел крупнейшее поражение в карьере

    обоснуй
    Ответить Цитировать
    435/505
    + 2
  • barbeysize @ 19.3.2018
    на прошлых выборах этого не было, а на этих есть - наблюдатели в чечне. где наблюдателей нет, там 99/99. где есть - там обыденность со средней явкой.


    Где вот насчет этого почитать результаты?Просто интересно какая там реальная явка.
    Ответить Цитировать
    148/162
    + 0
  • очень слабо. много водички, а по факту про интересующие нас участки со 100% ничего. тем более, что даже про чечню я уже конкретно написал.

    какой часовой пояс дает 100% явку и 100% за победителя?
    какая национальность дает 100% явку и 100% за победителя?
    какой уровень жизни дает 100% явку и 100% за победителя?
    какое - городское или сельское - население дает 100% явку и 100% за победителя?
    чеченская или питерская культура дает 100% явку и 100% за победителя?
    какие моногорода (и почему) дают 100% явку и 100% за победителя?
    полская региональность дает 100% явку и 100% за победителя?

    ну ты понял, да? сеанс саморазоблачения с самоудалением
    Ответить Цитировать
    436/505
    + 0
  • PasHTeT28 @ 19.3.2018
    Где вот насчет этого почитать результаты?Просто интересно какая там реальная явка.

    верзилов в твиттере постил результаты. явка с наблюдателями была 30-60%, без наблюдателей 99+. на некоторые участки, например, приходили толпы левых людей, но когда встречали там наблюдателей, то просто разворачивались и уходили (иногда на соседние участки).
    Ответить Цитировать
    437/505
    + 0
  • barbeysize @ 19.3.2018
    ну ты понял, да? сеанс саморазоблачения с самоудалением


    Удалил сообщение, потому что понял, что совершаю ошибку. Спорю с тем, кто не привёл пока никаких данных, кроме сообщений с твиттера и картинок 2012 года. А также с тем, кто любое распределение называет "шляпой с хвостиками", а любое математическое доказательство сводит к "по моему мнению". Зачем тебе вообще математика в таком случае, когда ты просто мог написать: "по моему мнению вбросы 20%"? И ведь не поспоришь, мнение есть мнение.
    Про 100% позабавило. В Польше и Канаде, конечно, есть территории/национальности, которые определяют что-то на 100% (самому-то не смешно?) Нет, статистика так не работает. У каждой гетерогенной группы может быть своё mean, своё deviation и своё распределение, и это всё сильно искажает общее распределение в сторону от нормального, в некоторых случаях приводит к мультимодальным распределениям и т.д. Но тебе-то это всё зачем? Когда есть ничем не подкреплённое "моё мнение".

    В-общем, подождём от тебя данных, а не каких-то картинок 8летней давности и данных уровня "в твиттере написали".
    Ответить Цитировать
    189/220
    + 3
1 2380 2381 2382 2383 2498
39 человек читают эту тему (39 гостей):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.