Das KapitalЪ (совместный блог Nameless и Khishtaki)

851
Статистика
Статистика
851
  • 500+
    подписчиков
Статистика темы
  • Популярность
    Топ-44
  • Постов
    20,834
  • Просмотров
    2,787,460
  • Подписок
    851
  • Карма автора
    +23,524
1 272 273 274 275 1042
  • БоевойСлон @ 20.12.2016
    Цитата (Nameless00 @ 20.12.2016)
    Итог "я не помелочился"Ок, просто к справедливости это имеет мало отношения, поэтому я не мог понять, что ты имеешь ввиду.


    А что вообще тогда имеет отношение к справедливости, если это внутренняя индивидуальная мера оценки человека своих поступков и поступков окружающих?

    Ну да это оффтоп о терминах, замени это слово любым по желанию.
    Ответить Цитировать
    2294/6733
    + 0
  • БоевойСлон @ 20.12.2016
    предлагать раздел 99 к 1.


    Хорошо. Как должен по твоему действовать рациональный агент в игре Ультиматум против неизвестного оппонента, которого он не видел, не видит и никогда больше не увидит?

    Я надеюсь что в твоем большом ответе этот момент будет обозначен.

    Потому что по моему "всегда использовать эксплуатирующие стратегии, если они есть" - это вот как раз таки прямо про эту ситуацию.
    Ответить Цитировать
    2295/6733
    + 0
  • Просто по твоей же логике забирать деньги на каждом следующем шагу ещё более несправедливо, чем на предыдущем. Ведь ты лишаешь партнёра ещё бОльшего количества денег.
    Ответить Цитировать
    457/1999
    + 0
  • БоевойСлон @ 20.12.2016
    Просто по твоей же логике забирать деньги на каждом следующем шагу ещё более несправедливо, чем на предыдущем. Ведь ты лишаешь партнёра ещё бОльшего количества денег.


    Да. Но и получаешь больше.
    Поэтому я и употребляю слово совесть.

    Почем готов продать свое душевное спокойствие.
    Ответить Цитировать
    2296/6733
    + 0
  • Nameless00 @ 20.12.2016
    Хорошо. Как должен по твоему действовать рациональный агент в игре Ультиматум против неизвестного оппонента, которого он не видел, не видит и никогда больше не увидит?

    Я надеюсь что в твоем большом ответе этот момент будет обозначен.

    Потому что по моему "всегда использовать эксплуатирующие стратегии, если они есть" - это вот как раз таки прямо про эту ситуацию.

    Если ты ожидаешь, что противник не согласится на раздел хуже, чем 70 на 30, то эксплуатирующей стратегией будет предлагать 70 на 30. Нерационально исходить из согласия партнёра на 99 к 1 потому-что-это-же-бля-равновесие-Нэша, если на самом деле вероятность такого согласия катастрофически мала. Про это мы с Констором и твердим.

    А вот что касается второго участника, почему он не соглашается на 99 к 1 - об этом будет мой длинный пост. Если очень вкратце - то он просто применяет к этой искусственно созданной ситуации тот же алгоритм, который оптимально иметь в естественных условиях.
    Сообщение отредактировал БоевойСлон - 20.12.2016, 11:45
    Ответить Цитировать
    458/1999
    + 0
  • БоевойСлон, это разные игры. Ты про Диктатора.
    Ультиматум - это тебе дали денег и ты делишь ее между тобой и оппонентом и на этом ВСЕ.

    И там все равно не 99/1.

    P.S. Но вообще я разочарован. Я же прямым текстом подробно в своем большом посте перечислил на что отвечает ваша гипотеза и на что моя и там эта ситуация была разобрана уже. Мне начинает казаться что ты невнимательно его прочитал.
    Ответить Цитировать
    2297/6733
    + 0
  • Ты уж определись с названиями. Какой нафиг ультиматум, какой нафиг предлагать, если ты делишь и всё.
    Ответить Цитировать
    459/1999
    + 0
  • Nameless00 @ 20.12.2016
    Я же прямым текстом подробно в своем большом посте перечислил на что отвечает ваша гипотеза и на что моя и там эта ситуация была разобрана уже. Мне начинает казаться что ты невнимательно его прочитал.

    А я прямым текстом написал, что мы не выдвигаем о гипотезу "реальные люди руководствуются только рациональными мотивами". Мы говорим о том, что было бы, если бы люди руководствовались только рациональными мотивами. А ты продолжаешь смешивать эти два утверждения.

    Если птицы летают благодаря тому, что махают крыльями, это не значит, что махать крыльями - необходимое условие для полёта.
    Сообщение отредактировал БоевойСлон - 20.12.2016, 11:57
    Ответить Цитировать
    460/1999
    + 0
  • БоевойСлон @ 20.12.2016
    Ты уж определись с названиями. Какой нафиг ультиматум, какой нафиг предлагать, если ты делишь и всё.


    Названия придумал не я.
    Что они значат описано в исходном посте
    Вот тут

    Мое отношение к тому что следует объяснять в рамках гипотезы о рациональности, а что уже объяснено - перечислено по пунктам Вот тут

    Названия игр в этих постах совпадают.

    БоевойСлон @ 20.12.2016
    Мы говорим о том, что было бы, если бы люди руководствовались только рациональными мотивами. А ты продолжаешь смешивать эти два утверждения


    Вас несколько и вы говорите о разном. Поэтому я отдельно отметил что сейчас разбираю один единственный вопрос - как действуют люди на самом деле прямо сейчас.

    Вопрос о том, как могли бы еще действовать для достижения того же результата - будет следующим, когда достигнем ясности тут.

    Третьим будет про груповой отбор.

    P.S. И кстати, вопрос на который я отвечаю - он же прямо в первых строках моего поста озвучен специально.
    Сообщение отредактировал Nameless00 - 20.12.2016, 12:25
    Ответить Цитировать
    2298/6733
    + 0
  • Nameless00, так походу с первым вопросом ни кто и не спорит :)
    Ответить Цитировать
    89/165
    + 0
  • ZiingRR @ 20.12.2016
    Nameless00, так походу с первым вопросом ни кто и не спорит :)


    Ну если выяснится что с ним уже никто не спорит - перейдем ко второму.
    Время сэкономим.
    Ответить Цитировать
    2299/6733
    + 0
  • Люди прямо сейчас действуют исходя из сочетания рационального расчёта и эмоций. Если ты согласен с такой формулировкой, то переходим ко второму вопросу. А названия игр ты действительно перепутал уже в первом посте. Предлагаю бегло погуглить и вернуться к правильным названиям.
    Ответить Цитировать
    461/1999
    + 0
  • Khishtaki @ 20.12.2016
    я бы глубже пошёл. "Моя оценка в моих глазах выросла (не упала), я - крутой, не то, что некоторые"


    Это уже детали. Стыд с одной стороны, понты с другой. В любом случае это нерационально и эмоции.
    Ответить Цитировать
    2300/6733
    + 0
  • Nameless00 @ 20.12.2016
    Вас несколько и вы говорите о разном


    не, никто не утверждал, что все люди рациональны или что-то такое. Более того, "рационалисты" как раз активнее других утверждают обратное и стремятся это исправить по мере возможностей.


    Nameless00 @ 20.12.2016
    Хорошо. Как должен по твоему действовать рациональный агент в игре Ультиматум против неизвестного оппонента, которого он не видел, не видит и никогда больше не увидит?


    это тоже мисконцепшн теории игр: она не всегда может предложить лучшую стратегия (точнее дело не в теории, а в том, что для некоторых игр универсальных ответов просто нет).
    Я выше писал что должен и чего не должен делать рациональный игрок в общем случае. В этой игре нет ни dominated, ни dominant, ни never a best response. Дальше начинаются уже всякие условия. При предположении, что rationality is a common knowledge мы получаем, что первому игроку рационально делить 99-1. Равновесие Нэша кстати тут совсем не пашет (что не редкость в играх с не фиксированной суммой), т.к. выглядит оно вот так: {первый делит 100-0, второй игрок отвергает}.
    В итоге, когда мы играем в абсолютном вакууме, то единственно верного ответа нет, можно лишь спекулировать (наверное 99-1 лучше остального).
    Когда же мы играем в условиях реальной жизни, у нас есть некоторое представление о наших оппонентах, мы можем делать предположение по чуйке (=основанное на опыте) и тем самым выбрать некоторый вариант более обоснованно чем другие. Тут важно понимать, что это не чуйка такая крутая, а тот факт, что в ситуации, когда все опции примерно равны, чуйка играет решающую роль.
    Например, в дилемме заключённого, как бы сильно чуйка нам не говорила, что оппонент будет сотрудничать, мы обязаны (это рационально) предавать.


    з.ы. извиняюсь за английские термины, но по теории игр в основном на английском читал
    Ответить Цитировать
    47/246
    + 0
  • Кстати, всем кому интересно поизучать теорию игр, рекомендую вот этот курс лекций.
    Тут есть и видео, и саммари лекций.
    Математическая подготовка не нужна, лектор очень доступно и хорошо всё объясняет.
    Единственный "минус" — английский язык.
    Ответить Цитировать
    48/246
    + 0
  • Nameless00 @ 20.12.2016
    БоевойСлон, это разные игры. Ты про Диктатора.
    Ультиматум - это тебе дали денег и ты делишь ее между тобой и оппонентом и на этом ВСЕ.


    ConstOr, вот
    Ответить Цитировать
    2301/6733
    + 0
  • Констор, ты неправильно посчитал равновесие Нэша в Ультиматуме. Любое сочетание стратегий "предлагаю Х" / отказываюсь если дают меньше Х является равновесием.

    Nameless, может всё-таки воспользуешься гуглом перед тем, как настаивать на неправильных названиях?
    Ответить Цитировать
    462/1999
    + 0
  • БоевойСлон, ну не неправильно, мой вариант то тоже равновесие, просто не заметил, что ещё куча вот таких есть, да.
    Тем не менее, мой пример был для иллюстрации, что нельзя тупо взять равновесие Нэша и фигачить им в неизвестных оппонентов в играх с нефиксированной суммой.


    Nameless00, окей, для игры Ультиматум (на самом деле видимо Диктатор) там же вообще получается вырожденный случай, когда у нас нет второго игрока? То есть просто decision making. Ну такие задачи тривиально решаются, если ты дашь мне функцию полезности от денег.
    То есть тут то, о чём я в прошлый раз писал: нужно аккуратно промоделировать. Если мы считаем, что деньги = полезность, то очевидно надо забирать всю сумму. Однако нельзя потом говорить про совесть и эмоции, т.к. если они есть, то их надо учесть в модели изначально.
    По сути эта игра как раз хороший калибровщик функции полезности: разделяя деньги каким-то образом, человек показывает стоимость эмоциональной составляющей для данной ситуации в деньгах.
    Ответить Цитировать
    49/246
    + 0
  • Что касается игры с портфелем, то всё-таки нужны какие-то свидетельства, что люди играют не исходя в значительной степени из надежды именно выиграть побольше.

    Например, я бы посмотрел, как играли бы люди, если бы игра шла не на деньги, а на очки в турнире из нескольких игроков. Если они тоже будут передавать портфель, то это уже не объяснишь стыдом и понтами.
    Ответить Цитировать
    463/1999
    + 1
  • Ну что же, начинаю писать обещанный длинный пост. Получится даже серия длинных постов на несколько связанных тем. И начну с темы "Предказание действией оппа и прекоммит".

    Рассмотрим задачу про пиратов (условие на русском легко гуглится). Якобы рациональный ответ выглядит так: первый пират предлагает делёжку 98-0-1-0-1. Он предсказывает следующий ход мыслей третьего и пятого пиратов: "Если мы проголосуем против, то второй пират предложит делёжку 99-0-1-0, просчитав, что четвёртый пират на это согласится, потому что в свою очередь просчитает, что третий пират ничего ему не даст, и т.д."
    Иными словами, предполагается фантастическая способность пиратов предсказывать будущие решения друг друга при разных сценариях. Первый пират настолько уверен в своих предсказаниях, что готов поставить свою жизнь на то, что он не ошибся в ходе мыслей и действиях 3-его и 5-ого пиратов, которые в свою очередь основаны на абсолютной уверенности в том, что они "читают" 2-ого и 4-ого.

    Представим теперь, что в мире пиратов, как в HPMOR, есть нерушимый обет, только вместо сложного заклинания достаточно сказать "зуб даю". И услышав предложение, второй пират заявляет "Зуб даю, что если мы выкинем этого жадного ублюдка, то я предложу равную делёжку. Это называется precommit и полностью меняет исход игры.

    Ответом на это предполагается, что нерушимых обетов не бывает, и второй пират может обещать что угодно, всё равно у остальных нет никаких причин ему верить. Поэтому 3й и 5й согласятся получить по одной монете. Но напомню - этот ответ требует, чтобы пираты могли точно предсказывать поведение друг друга! Что же будет, если 2-й пират действительно "твёрдо решит", что он поделит поровну? Остальные пираты предскажут это его поведение, и 1й пират отправится за борт.

    И что же теперь делать второму пирату? Рационально ли выполнять своё обещание, нельзя ли предложить 99-0-1-0? Ответ очень простой - он уже сделал свой выбор на предыдущем шаге. Если он сейчас предложит 99-0-1-0, то это означает, что 3й и 5й пираты не поверили бы ему, и приняли бы предложение первого. Мы же помним, что пираты способны предсказывать поведение друг друга. Иными словами, действия 2ого пирата рассматриваются не как набор отдельных решений, а как заранее выбранный и публично объявленный алгоритм, от которого он не может уклониться.

    Так чем же в итоге закончится такая игра с учётом обязательств? Ответа на это нет. Понятно, что 1й пират не будет делать жадных предложений. Понятно, что все остальные пираты тоже могут брать на себя прекоммиты, прекоммиты, зависящие от других прекоммитов, и т.п. Вместо пошаговой игры у нас будут сложные многосторонние переговоры, и тут, наверное, надо изучать теорию коалиционных игр и теорию контрактов. По большому счёту практически любой раздел монет может быть равновесием Нэша при определённом наборе обязательств.

    Рассмотрим теперь повторяющуюся дилемму заключённого с фиксированным N в условиях взаимного "ясновидения". Проблема последней итерации при этом отпадает сама собой. Я не могу предавать на последней итерации, потому что тогда другой игрок предвидит это и не будет сотрудничать на предыдущем ходу, и т.д. Поэтому оптимальным решением будет именно стратегия "око за око". При этом оппонент тоже не будет предавать меня на последней улице, поскольку знает, что я смогу это предсказать.

    Аналогично, в игре "Ультиматум" становится рационально отказываться от явно невыгодных предложений, поскольку предсказав такой отказ, первый игрок будет вынужден предложить больше. В игре с портфелем становится оптимально начинать с высокой вероятности передачи портфеля и постепенно понижать её до нуля к концу игры.

    Итого если к"rationality is common knowledge" мы добавляем возможность игроков предсказывать действия друг друга, то это полностью меняет взгляд на проблему и во многом решает проблему сотрудничества. И основным принципом поведения становится "поступай так, как если бы другие люди могли предсказать твоё действие заранее". Можно назвать эту модель "взаимодействием рациональных агентов с открытым исходным кодом".

    В следующем посте я разберу, какое отношение имеет эта модель к действиям людей в реальном мире. Пока же отмечу, что в задаче про пиратов 2ому пирату необязательно, чтобы ему поверили на 100%. 3ему и 5ому пиратам достаточно оценить вероятность выполнения обещания всего в 10%, чтобы выбросить за борт 1ого. А 1ому пирату достаточно самой минимальной опасности такого сговора, чтобы предложить более справедливую делёжку.
    Сообщение отредактировал БоевойСлон - 20.12.2016, 22:16
    Ответить Цитировать
    464/1999
    + 4
1 272 273 274 275 1042
14 человек читают эту тему (14 гостей):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.