Das KapitalЪ (совместный блог Nameless и Khishtaki) (270-я страница)

По дате По рейтингу

Только автор

← 1 269 270 271 272 1042 →

Автор

Блог Профиль Личное сообщение

Nameless00

Автор

17.12.2016 01:58

23,526 10,435
15 лет на сайте

Кстати, а вы знаете что нит это единица измерения яркости?
Все логично, только зависимость обратная. Чем меньше нит, тем ярче выступает за столом.

Ответить Цитировать

2278/6733

Ссылка скопирована

17.12.2016 01:58

+ 2 –
Блог Профиль Личное сообщение

ConstOr

17.12.2016 03:55

7,552 9,611
16 лет на сайте

Мне кажется, что примеры с мафией и такси не особо релевантны, т.к. это итерационная дилемма заключенного, где вполне рационально сотрудничать, безо всяких стимулов (эмоций).
А ещё в обоих случаях скорее всего присутствует вполне конкретный стимул в виде пиздюлей, если кто узнает про твой косяк (то же самое, что наказание за несоблюдение закона в государстве).

Ответить Цитировать

40/246

Ссылка скопирована

17.12.2016 03:55

+ 0 –
Автор

Блог Профиль Личное сообщение

Nameless00

Автор

17.12.2016 04:38

23,526 10,435
15 лет на сайте

ConstOr @ 16.12.2016
Мне кажется, что примеры с мафией и такси не особо релевантны, т.к. это итерационная дилемма заключенного, где вполне рационально сотрудничать, безо всяких стимулов (эмоций).
А ещё в обоих случаях скорее всего присутствует вполне конкретный стимул в виде пиздюлей, если кто узнает про твой косяк (то же самое, что наказание за несоблюдение закона в государстве).

Сначала об отличиях. Тут правила неизвестны, в отличие от дилеммы заключенного. Но есть понимание того, что
1. Все хотят кушать
2. Поляна не бесконечная

Рациональны было бы вообще никого со стороны не пускать. И возможности к этому имеются. Но это не так. "Нормальных пацанов" пускают, хоть и нехотя поначалу.

Теперь о сходстве.
Я в оригинальном посте написал же сразу, что в принципе жизнь - это итерационная дилемма заключённого. Но с неизвестными правилами и непредсказуемыми результатами.
В таких условиях рациональные агенты не способны договориться, потому что ну как ты определишь выгодно тебе сотрудничать или нет, если неизвестна ни цена сотрудничества, ни выхлоп, а жертвовать надо вот здесь и сейчас, потом будет уже поздно, все места заняты.

А иррациональные люди сами того не зная оперируют приблизительной репутационной оценкой и презумпцией честности и справедливости и как-то договариваются.

Есть конечно и те кто рационально эксплуатируют уже сложившуюся систему. Жиголо например.
Ну или те кто заранее продумывают как сойти за своего им не являясь, чтобы получить доступ к закрытому ресурсу, типа каких нибудь продавцов алмазов, которые все известны по именам.

Но чтобы система сложилась изначально, необходимо вот то самое. Справедливость и стыд и репутация.

P.S. Хотя если ты считаешь поступок "я сделаю добро сейчас, потому что кто-то это увидит и возможно в будущем сделает добро мне" рациональным, тогда мы называем разными словами одно и то же.

Ответить Цитировать

2279/6733

Ссылка скопирована

17.12.2016 04:38

+ 1 –
Блог Профиль Личное сообщение

ConstOr

17.12.2016 13:34

7,552 9,611
16 лет на сайте

Nameless00 @ 17.12.2016
Тут правила неизвестны, в отличие от дилеммы заключенного

Ну для дилеммы заключенного важна суть: сотрудничать вместе выгоднее, чем нет. Предавать выгоднее всего, быть преданным хуже всего.
Что и насколько выгоднее, значения не имеет.

Nameless00 @ 17.12.2016
Рациональны было бы вообще никого со стороны не пускать. И возможности к этому имеются. Но это не так. "Нормальных пацанов" пускают, хоть и нехотя поначалу.

Я не большой спец в таксистах и мафии, но чуйка подсказывает, что пускают они не из доброты душевной, а потому что им это выгодно. То есть либо поляна больше, чем их, либо это способ избежать того, что все отвергнутые объеденятся и дадут люлей.

Nameless00 @ 17.12.2016
В таких условиях рациональные агенты не способны договориться, потому что ну как ты определишь выгодно тебе сотрудничать или нет, если неизвестна ни цена сотрудничества, ни выхлоп, а жертвовать надо вот здесь и сейчас, потом будет уже поздно, все места заняты.

Рациональные агенты и не должны договариваться. Просто зуб-за-зуб с сотрудничеством в начале — лучшая стратегия в таких ситуациях (читай рациональная). Поэтому я и называю сотрудничество рациональным. То есть тебе не нужны эмоциональные стимулы (в этих двух примерах), чтобы поступать именно так. Участники головой понимают, что кидать им не выгодно.

А на деле в этих ситуациях, в случае первого кидка, ты получаешь такое -ев (пиздюли), что "игра" из интересной дилеммы заключенного превращается в тривиальную, где ты тупо всегда должен сотрудничать by design, т.к. предавать перестаёт быть выгоднее.

Ответить Цитировать

41/246

Ссылка скопирована

17.12.2016 13:34

+ 0 –
Блог Профиль Личное сообщение

eazzzyyyyy

17.12.2016 14:00

1,227 605
14 лет на сайте

Nameless00 @ 16.12.2016
Хорошо бы найти статью, понятнее было бы.

Вот вроде - http://elementy.ru/novosti_nauki/432714/Mozg_otlichaet_raschetlivoe_dobro_ot_beskorystnykh_poryvov

Ответить Цитировать

6/338

Ссылка скопирована

17.12.2016 14:00

+ 1 –
Автор

Блог Профиль Личное сообщение

Nameless00

Автор

17.12.2016 15:22

23,526 10,435
15 лет на сайте

ConstOr @ 17.12.2016
Я не большой спец в таксистах и мафии, но чуйка подсказывает, что пускают они не из доброты душевной, а потому что им это выгодно. То есть либо поляна больше, чем их, либо это способ избежать того, что все отвергнутые объеденятся и дадут люлей.

Это не так.

Ответить Цитировать

2280/6733

Ссылка скопирована

17.12.2016 15:22

+ 0 –
Автор

Блог Профиль Личное сообщение

Nameless00

Автор

17.12.2016 16:10

23,526 10,435
15 лет на сайте

ConstOr @ 17.12.2016
Рациональные агенты и не должны договариваться. Просто зуб-за-зуб с сотрудничеством в начале — лучшая стратегия в таких ситуациях (читай рациональная). Поэтому я и называю сотрудничество рациональным.

Да. Вспомнил, ты же считаешь что любая правильная, идеальная стратегия - это рациональная, а неправильная, неидеальная - не рациональная.

С такой трактовкой не поспоришь.

Ответить Цитировать

2281/6733

Ссылка скопирована

17.12.2016 16:10

+ 1 –
Профиль Личное сообщение

ZiingRR

17.12.2016 16:56

-1,026 529
12 лет на сайте

Арбитраж!

Рациональные агенты и не должны договариваться. Просто зуб-за-зуб с сотрудничеством в начале — лучшая стратегия в таких ситуациях (читай рациональная). Поэтому я и называю сотрудничество рациональным. То есть тебе не нужны эмоциональные стимулы (в этих двух примерах), чтобы поступать именно так. Участники головой понимают, что кидать им не выгодно.

В дилемме заключенного в последней итерации каждому рациональному агенту по отдельности выгоднее кинуть другого, т.к. репутацию больше незачем поддерживать. Зная это, репутация обесценивается в предпоследней итерации. И так далее.

В реальной жизни от этого спасают: наше встроенное чувство справедливости; репутация, влияющая на разные аспекты нашей жизни; боязнь получить пиздюлей. Ограничивающие факторы, короче. Коих не наблюдается в абстрактной модели (и кое-где в реальности).

Ответить Цитировать

81/165

Ссылка скопирована

17.12.2016 16:56

+ 0 –
Профиль Личное сообщение

БоевойСлон

17.12.2016 17:18

14,000 5,010
14 лет на сайте

Nameless, думаю, ты не совсем понял мысль Констора.
Ты пишешь, что
Nameless00 @ 17.12.2016
В таких условиях рациональные агенты не способны договориться, потому что ну как ты определишь выгодно тебе сотрудничать или нет, если неизвестна ни цена сотрудничества, ни выхлоп, а жертвовать надо вот здесь и сейчас, потом будет уже поздно, все места заняты.

А Констор тебе отвечает, что для выбора стратегии "сначала сотрудничаю, потом око за око" не нужно знать ни выхлопа, ни цены сотрудничества, ничего. Потому что эта стратегия и так является оптимальной в подавляющем большинстве повторяющихся взаимодействий (для относительно равноправных участников). Она основана на базовом предположении "о собственной типичности", т.е. что другие участники похожи на тебя и не настолько хуже (глупее, слабее), чтобы дать тебе просто так их надуть.
Собственно, не будь эта стратегия "обычно подходящей", он бы и не закрепилась в процессе эволюции.

Ответить Цитировать

438/1999

Ссылка скопирована

17.12.2016 17:18

+ 1 –
Автор

Блог Профиль Личное сообщение

Nameless00

Автор

17.12.2016 17:25

23,526 10,435
15 лет на сайте

БоевойСлон @ 17.12.2016
Потому что эта стратегия и так является оптимальной в подавляющем большинстве повторяющихся взаимодействий (для относительно равноправных участников).

Почему же, отлично понял. Но выше мое возражение уже привели.
Да, око за око - близкая к оптимальной стратегии. Является ли она рациональной при этом?
Нет, по указанной выше причине. Потому что действительно рациональные стратегии подразумевают кидок на последней итерации и далее по тексту.

Ответить Цитировать

2282/6733

Ссылка скопирована

17.12.2016 17:25

+ 0 –
Профиль Личное сообщение

БоевойСлон

17.12.2016 17:37

14,000 5,010
14 лет на сайте

Nameless00 @ 17.12.2016
Является ли она рациональной при этом?
Нет, по указанной выше причине. Потому что действительно рациональные стратегии подразумевают кидок на последней итерации и далее по тексту.

Это весьма спорное утверждение:
1) В жизни количество итераций заранее не фиксировано, поэтому ты не знаешь, когда будет последняя.
2) Эта утверждение не согласуется с фактами.

Аксельрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по ПДЗ.
...
Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.

Т.е. несмотря на то, что программы были написаны с единственной целью выиграть как можно больше, не было во взаимодействиях этих программ никакого "кидка на последних итерациях и далее по тексту". Вряд ли эти программы и их авторы руководствовались эмоциями и чувством стыда?

Хотя я не знаю, что ты подразумеваешь под "действительно рациональной стратегией"?

Сообщение отредактировал БоевойСлон - 17.12.2016, 17:58

Ответить Цитировать

439/1999

Ссылка скопирована

17.12.2016 17:37

+ 0 –
Профиль Личное сообщение

ZiingRR

17.12.2016 18:54

-1,026 529
12 лет на сайте

Арбитраж!

Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда, вне зависимости от предыдущего шага, сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.

Играя против такого агента, его копия с модификацией "всегда кидать на последней итерации" наберёт больше очков, разве нет?

Ответить Цитировать

82/165

Ссылка скопирована

17.12.2016 18:54

+ 0 –
Профиль Личное сообщение

БоевойСлон

17.12.2016 19:22

14,000 5,010
14 лет на сайте

Во-первых, я уже сказал, что в жизни ты не знаешь, какая итерация последняя. Во-вторых, даже в твоём случае программа "всегда кидать" набереёт меньше, чем обе эти программы. Потому что она с каждой соберёт всего по одному раунду, а эти две поделят между собой N-1 результатов сотрудничества.

В любом случае, мы знаем, что в реальных экспериментах с программами отсутствие сотрудничества по этой логике не оказывается выгодным. Из этого факта и надо исходить.

Если модель приводит к выводу, что выгодно всегда кидать, а фактический эксперимент показал противоположное, значит в модели что-то не учтено.

Сообщение отредактировал БоевойСлон - 17.12.2016, 20:10

Ответить Цитировать

440/1999

Ссылка скопирована

17.12.2016 19:22

+ 0 –
Профиль Личное сообщение

БоевойСлон

17.12.2016 20:20

14,000 5,010
14 лет на сайте

Nameless00 @ 17.12.2016
Я в оригинальном посте написал же сразу, что в принципе жизнь - это итерационная дилемма заключённого. Но с неизвестными правилами и непредсказуемыми результатами.
В таких условиях рациональные агенты не способны договориться, потому что ну как ты определишь выгодно тебе сотрудничать или нет, если неизвестна ни цена сотрудничества, ни выхлоп, а жертвовать надо вот здесь и сейчас, потом будет уже поздно, все места заняты.

Вообще, чтобы опять не упираться в бессмысленные разговоры об определениях, надо переформулировать это утверждение без использования слова "рациональный" и его ближайших синонимов.

Ответить Цитировать

441/1999

Ссылка скопирована

17.12.2016 20:20

+ 0 –
Профиль Личное сообщение

ZiingRR

17.12.2016 21:16

-1,026 529
12 лет на сайте

Арбитраж!

БоевойСлон, я под "рациональными агентами" имел в виду, что каждый при удобном случае старается заэксплойтить другого, и каждый об этом знает, и каждый знает что каждый знает и т.д. С случае дилеммы заключенного это не выгодно, но ведь это "природа" рациональных эгоистичных агентов. В последней итерации ты должен предать напарника, т.к. это минимизирует время отсидки в любом случае. И если напарник знает об этом...

P.S. Здесь не нужно знать какая отсидка последняя. Главное знать что она в принципе будет.

Сообщение отредактировал ZiingRR - 17.12.2016, 21:26

Ответить Цитировать

83/165

Ссылка скопирована

17.12.2016 21:16

+ 0 –
Профиль Личное сообщение

БоевойСлон

17.12.2016 22:30

14,000 5,010
14 лет на сайте

Как это не важно знать, какая итерация последняя. Если ты ни в один момент не можешь быть уверен, что именно эта итерация с большой вероятностью последняя, то тебе ни в один момент невыгодно предавать (против стратегии око за око).

Ну и тут же нет цели максимально заэксплойтить каждого. Цель - выработать линию поведения, которая даст наилучший результат в среднем, против всего множества оппов.

Ответить Цитировать

442/1999

Ссылка скопирована

17.12.2016 22:30

+ 0 –
Профиль Личное сообщение

ZiingRR

17.12.2016 22:32

-1,026 529
12 лет на сайте

Арбитраж!

Насчёт своего постскриптума не уверен. Где-то читал, что этой неопределенностью (в конечной версии игры) обеспечивается кооперация на всём пути. Туплю я что-то, не пойму какую погоду это делает.

Ответить Цитировать

84/165

Ссылка скопирована

17.12.2016 22:32

+ 0 –
Профиль Личное сообщение

БоевойСлон

17.12.2016 22:46

14,000 5,010
14 лет на сайте

Пусть в каждый момент игра продолжится с вероятностью 95% и закончится с вероятностью 5%. У неё будет конечное матожидание длительности, многие физические и экономические процессы имеют сходные свойства. В этом случае пара стратегий "око за око" будет одним из равновесий Нэша (при достаточной выгоде от кооперации).

А если к этому добавить, что в обсуждаемой ситуации твоё действие становится известным не только твоему текущему оппу, а и всем остальным, то стратегия предательства вообще практически перестаёт рассматриваться.

Ответить Цитировать

443/1999

Ссылка скопирована

17.12.2016 22:46

+ 1 –
Профиль Личное сообщение

ZiingRR

17.12.2016 22:59

-1,026 529
12 лет на сайте

Арбитраж!

БоевойСлон @ 17.12.2016
Ну и тут же нет цели максимально заэксплойтить каждого. Цель - выработать линию поведения, которая даст наилучший результат в среднем, против всего множества оппов.

В ДЗ это же предпосылка, что агенты рациональны и эгоистичны. Если играть против среднего человека, или не знать на 100℅ что твой оппонент рационален, стратегия будет другой. Но не об этом идёт речь.

Блин, я спать пошёл.

Ответить Цитировать

85/165

Ссылка скопирована

17.12.2016 22:59

+ 0 –
Профиль Личное сообщение

БоевойСлон

17.12.2016 23:18

14,000 5,010
14 лет на сайте

ZiingRR @ 17.12.2016
В ДЗ это же предпосылка, что агенты рациональны и эгоистичны. Если играть против среднего человека, или не знать на 100℅ что твой оппонент рационален, стратегия будет другой.

В ДЗ есть условия игры и есть выигрыши игроков. Цель - максимизировать матожидание выигрыша. Все остальные предположения, какие бы они ни были, необязательны. Слово "рациональность" в определении вообще не встречается.

Ответить Цитировать

444/1999

Ссылка скопирована

17.12.2016 23:18

+ 0 –

← 1 269 270 271 272 1042 →

20834 поста

Подписаться на обновления темы по почте

23 человека читают эту тему (23 гостя):

Форум GipsyTeam Офлайн Кэш-игра

Войти или зарегистрироваться

Зачем регистрироваться на GipsyTeam?

Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
На каждой странице будет видно, где появились новые посты и комментарии.
Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.