Das KapitalЪ (совместный блог Nameless и Khishtaki)

851
Статистика
Статистика
851
  • 500+
    подписчиков
Статистика темы
  • Популярность
    Топ-36
  • Постов
    20,834
  • Просмотров
    2,792,498
  • Подписок
    851
  • Карма автора
    +23,526
1 269 270 271 272 1042
  • Кстати, а вы знаете что нит это единица измерения яркости?
    Все логично, только зависимость обратная. Чем меньше нит, тем ярче выступает за столом.
    Ответить Цитировать
    2278/6733
    + 2
  • Мне кажется, что примеры с мафией и такси не особо релевантны, т.к. это итерационная дилемма заключенного, где вполне рационально сотрудничать, безо всяких стимулов (эмоций).
    А ещё в обоих случаях скорее всего присутствует вполне конкретный стимул в виде пиздюлей, если кто узнает про твой косяк (то же самое, что наказание за несоблюдение закона в государстве).
    Ответить Цитировать
    40/246
    + 0
  • ConstOr @ 16.12.2016
    Мне кажется, что примеры с мафией и такси не особо релевантны, т.к. это итерационная дилемма заключенного, где вполне рационально сотрудничать, безо всяких стимулов (эмоций).
    А ещё в обоих случаях скорее всего присутствует вполне конкретный стимул в виде пиздюлей, если кто узнает про твой косяк (то же самое, что наказание за несоблюдение закона в государстве).


    Сначала об отличиях. Тут правила неизвестны, в отличие от дилеммы заключенного. Но есть понимание того, что
    1. Все хотят кушать
    2. Поляна не бесконечная

    Рациональны было бы вообще никого со стороны не пускать. И возможности к этому имеются. Но это не так. "Нормальных пацанов" пускают, хоть и нехотя поначалу.

    Теперь о сходстве.
    Я в оригинальном посте написал же сразу, что в принципе жизнь - это итерационная дилемма заключённого. Но с неизвестными правилами и непредсказуемыми результатами.
    В таких условиях рациональные агенты не способны договориться, потому что ну как ты определишь выгодно тебе сотрудничать или нет, если неизвестна ни цена сотрудничества, ни выхлоп, а жертвовать надо вот здесь и сейчас, потом будет уже поздно, все места заняты.

    А иррациональные люди сами того не зная оперируют приблизительной репутационной оценкой и презумпцией честности и справедливости и как-то договариваются.

    Есть конечно и те кто рационально эксплуатируют уже сложившуюся систему. Жиголо например.
    Ну или те кто заранее продумывают как сойти за своего им не являясь, чтобы получить доступ к закрытому ресурсу, типа каких нибудь продавцов алмазов, которые все известны по именам.

    Но чтобы система сложилась изначально, необходимо вот то самое. Справедливость и стыд и репутация.

    P.S. Хотя если ты считаешь поступок "я сделаю добро сейчас, потому что кто-то это увидит и возможно в будущем сделает добро мне" рациональным, тогда мы называем разными словами одно и то же.
    Ответить Цитировать
    2279/6733
    + 1
  • Nameless00 @ 17.12.2016
    Тут правила неизвестны, в отличие от дилеммы заключенного


    Ну для дилеммы заключенного важна суть: сотрудничать вместе выгоднее, чем нет. Предавать выгоднее всего, быть преданным хуже всего.
    Что и насколько выгоднее, значения не имеет.

    Nameless00 @ 17.12.2016
    Рациональны было бы вообще никого со стороны не пускать. И возможности к этому имеются. Но это не так. "Нормальных пацанов" пускают, хоть и нехотя поначалу.


    Я не большой спец в таксистах и мафии, но чуйка подсказывает, что пускают они не из доброты душевной, а потому что им это выгодно. То есть либо поляна больше, чем их, либо это способ избежать того, что все отвергнутые объеденятся и дадут люлей.


    Nameless00 @ 17.12.2016
    В таких условиях рациональные агенты не способны договориться, потому что ну как ты определишь выгодно тебе сотрудничать или нет, если неизвестна ни цена сотрудничества, ни выхлоп, а жертвовать надо вот здесь и сейчас, потом будет уже поздно, все места заняты.


    Рациональные агенты и не должны договариваться. Просто зуб-за-зуб с сотрудничеством в начале — лучшая стратегия в таких ситуациях (читай рациональная). Поэтому я и называю сотрудничество рациональным. То есть тебе не нужны эмоциональные стимулы (в этих двух примерах), чтобы поступать именно так. Участники головой понимают, что кидать им не выгодно.

    А на деле в этих ситуациях, в случае первого кидка, ты получаешь такое -ев (пиздюли), что "игра" из интересной дилеммы заключенного превращается в тривиальную, где ты тупо всегда должен сотрудничать by design, т.к. предавать перестаёт быть выгоднее.
    Ответить Цитировать
    41/246
    + 0
  • Nameless00 @ 16.12.2016
    Хорошо бы найти статью, понятнее было бы.


    Вот вроде - http://elementy.ru/novosti_nauki/432714/Mozg_otlichaet_raschetlivoe_dobro_ot_beskorystnykh_poryvov
    Ответить Цитировать
    6/338
    + 1
  • ConstOr @ 17.12.2016
    Я не большой спец в таксистах и мафии, но чуйка подсказывает, что пускают они не из доброты душевной, а потому что им это выгодно. То есть либо поляна больше, чем их, либо это способ избежать того, что все отвергнутые объеденятся и дадут люлей.


    Это не так.
    Ответить Цитировать
    2280/6733
    + 0
  • ConstOr @ 17.12.2016
    Рациональные агенты и не должны договариваться. Просто зуб-за-зуб с сотрудничеством в начале — лучшая стратегия в таких ситуациях (читай рациональная). Поэтому я и называю сотрудничество рациональным.


    Да. Вспомнил, ты же считаешь что любая правильная, идеальная стратегия - это рациональная, а неправильная, неидеальная - не рациональная.

    С такой трактовкой не поспоришь.
    Ответить Цитировать
    2281/6733
    + 1

  • Рациональные агенты и не должны договариваться. Просто зуб-за-зуб с сотрудничеством в начале — лучшая стратегия в таких ситуациях (читай рациональная). Поэтому я и называю сотрудничество рациональным. То есть тебе не нужны эмоциональные стимулы (в этих двух примерах), чтобы поступать именно так. Участники головой понимают, что кидать им не выгодно.

    В дилемме заключенного в последней итерации каждому рациональному агенту по отдельности выгоднее кинуть другого, т.к. репутацию больше незачем поддерживать. Зная это, репутация обесценивается в предпоследней итерации. И так далее.

    В реальной жизни от этого спасают: наше встроенное чувство справедливости; репутация, влияющая на разные аспекты нашей жизни; боязнь получить пиздюлей. Ограничивающие факторы, короче. Коих не наблюдается в абстрактной модели (и кое-где в реальности).
    Ответить Цитировать
    81/165
    + 0
  • Nameless, думаю, ты не совсем понял мысль Констора.
    Ты пишешь, что
    Nameless00 @ 17.12.2016
    В таких условиях рациональные агенты не способны договориться, потому что ну как ты определишь выгодно тебе сотрудничать или нет, если неизвестна ни цена сотрудничества, ни выхлоп, а жертвовать надо вот здесь и сейчас, потом будет уже поздно, все места заняты.

    А Констор тебе отвечает, что для выбора стратегии "сначала сотрудничаю, потом око за око" не нужно знать ни выхлопа, ни цены сотрудничества, ничего. Потому что эта стратегия и так является оптимальной в подавляющем большинстве повторяющихся взаимодействий (для относительно равноправных участников). Она основана на базовом предположении "о собственной типичности", т.е. что другие участники похожи на тебя и не настолько хуже (глупее, слабее), чтобы дать тебе просто так их надуть.
    Собственно, не будь эта стратегия "обычно подходящей", он бы и не закрепилась в процессе эволюции.
    Ответить Цитировать
    438/1999
    + 1
  • БоевойСлон @ 17.12.2016
    Потому что эта стратегия и так является оптимальной в подавляющем большинстве повторяющихся взаимодействий (для относительно равноправных участников).


    Почему же, отлично понял. Но выше мое возражение уже привели.
    Да, око за око - близкая к оптимальной стратегии. Является ли она рациональной при этом?
    Нет, по указанной выше причине. Потому что действительно рациональные стратегии подразумевают кидок на последней итерации и далее по тексту.
    Ответить Цитировать
    2282/6733
    + 0
  • Nameless00 @ 17.12.2016
    Является ли она рациональной при этом?
    Нет, по указанной выше причине. Потому что действительно рациональные стратегии подразумевают кидок на последней итерации и далее по тексту.

    Это весьма спорное утверждение:
    1) В жизни количество итераций заранее не фиксировано, поэтому ты не знаешь, когда будет последняя.
    2) Эта утверждение не согласуется с фактами.

    Аксельрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по ПДЗ.
    ...
    Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.


    Т.е. несмотря на то, что программы были написаны с единственной целью выиграть как можно больше, не было во взаимодействиях этих программ никакого "кидка на последних итерациях и далее по тексту". Вряд ли эти программы и их авторы руководствовались эмоциями и чувством стыда?

    Хотя я не знаю, что ты подразумеваешь под "действительно рациональной стратегией"?
    Сообщение отредактировал БоевойСлон - 17.12.2016, 17:58
    Ответить Цитировать
    439/1999
    + 0

  • Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.

    Играя против такого агента, его копия с модификацией "всегда кидать на последней итерации" наберёт больше очков, разве нет?
    Ответить Цитировать
    82/165
    + 0
  • Во-первых, я уже сказал, что в жизни ты не знаешь, какая итерация последняя. Во-вторых, даже в твоём случае программа "всегда кидать" набереёт меньше, чем обе эти программы. Потому что она с каждой соберёт всего по одному раунду, а эти две поделят между собой N-1 результатов сотрудничества.

    В любом случае, мы знаем, что в реальных экспериментах с программами отсутствие сотрудничества по этой логике не оказывается выгодным. Из этого факта и надо исходить.

    Если модель приводит к выводу, что выгодно всегда кидать, а фактический эксперимент показал противоположное, значит в модели что-то не учтено.
    Сообщение отредактировал БоевойСлон - 17.12.2016, 20:10
    Ответить Цитировать
    440/1999
    + 0
  • Nameless00 @ 17.12.2016
    Я в оригинальном посте написал же сразу, что в принципе жизнь - это итерационная дилемма заключённого. Но с неизвестными правилами и непредсказуемыми результатами.
    В таких условиях рациональные агенты не способны договориться, потому что ну как ты определишь выгодно тебе сотрудничать или нет, если неизвестна ни цена сотрудничества, ни выхлоп, а жертвовать надо вот здесь и сейчас, потом будет уже поздно, все места заняты.

    Вообще, чтобы опять не упираться в бессмысленные разговоры об определениях, надо переформулировать это утверждение без использования слова "рациональный" и его ближайших синонимов.
    Ответить Цитировать
    441/1999
    + 0
  • БоевойСлон, я под "рациональными агентами" имел в виду, что каждый при удобном случае старается заэксплойтить другого, и каждый об этом знает, и каждый знает что каждый знает и т.д. С случае дилеммы заключенного это не выгодно, но ведь это "природа" рациональных эгоистичных агентов. В последней итерации ты должен предать напарника, т.к. это минимизирует время отсидки в любом случае. И если напарник знает об этом...

    P.S. Здесь не нужно знать какая отсидка последняя. Главное знать что она в принципе будет.
    Сообщение отредактировал ZiingRR - 17.12.2016, 21:26
    Ответить Цитировать
    83/165
    + 0
  • Как это не важно знать, какая итерация последняя. Если ты ни в один момент не можешь быть уверен, что именно эта итерация с большой вероятностью последняя, то тебе ни в один момент невыгодно предавать (против стратегии око за око).

    Ну и тут же нет цели максимально заэксплойтить каждого. Цель - выработать линию поведения, которая даст наилучший результат в среднем, против всего множества оппов.
    Ответить Цитировать
    442/1999
    + 0
  • Насчёт своего постскриптума не уверен. Где-то читал, что этой неопределенностью (в конечной версии игры) обеспечивается кооперация на всём пути. Туплю я что-то, не пойму какую погоду это делает.
    Ответить Цитировать
    84/165
    + 0
  • Пусть в каждый момент игра продолжится с вероятностью 95% и закончится с вероятностью 5%. У неё будет конечное матожидание длительности, многие физические и экономические процессы имеют сходные свойства. В этом случае пара стратегий "око за око" будет одним из равновесий Нэша (при достаточной выгоде от кооперации).

    А если к этому добавить, что в обсуждаемой ситуации твоё действие становится известным не только твоему текущему оппу, а и всем остальным, то стратегия предательства вообще практически перестаёт рассматриваться.
    Ответить Цитировать
    443/1999
    + 1
  • БоевойСлон @ 17.12.2016
    Ну и тут же нет цели максимально заэксплойтить каждого. Цель - выработать линию поведения, которая даст наилучший результат в среднем, против всего множества оппов.

    В ДЗ это же предпосылка, что агенты рациональны и эгоистичны. Если играть против среднего человека, или не знать на 100℅ что твой оппонент рационален, стратегия будет другой. Но не об этом идёт речь.

    Блин, я спать пошёл.
    Ответить Цитировать
    85/165
    + 0
  • ZiingRR @ 17.12.2016
    В ДЗ это же предпосылка, что агенты рациональны и эгоистичны. Если играть против среднего человека, или не знать на 100℅ что твой оппонент рационален, стратегия будет другой.

    В ДЗ есть условия игры и есть выигрыши игроков. Цель - максимизировать матожидание выигрыша. Все остальные предположения, какие бы они ни были, необязательны. Слово "рациональность" в определении вообще не встречается.
    Ответить Цитировать
    444/1999
    + 0
1 269 270 271 272 1042
17 человек читают эту тему (17 гостей):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.