Nameless00 @ 17.12.2016
Да, око за око - близкая к оптимальной стратегии. Является ли она рациональной при этом?
Нет, по указанной выше причине. Потому что действительно рациональные стратегии подразумевают кидок на последней итерации и далее по тексту.
ConstOr @ 18.12.2016
Возможно в этом кроется твоя нелюбовь к рационалистам и вообще к этому слову?
Nameless00 @ 18.12.2016
Наиболее рациональное и вообще единственное рациональное поведение тут - забирать деньги на первом ходу. Любое другое поведение ущербно (ну если мы не можем сговориться с оппонентом).
Nameless00 @ 18.12.2016
Почему я думаю что имеющегося положения не достигли бы изначально рациональные агенты.
ConstOr @ 18.12.2016
Ты похоже не понял как это работает и сделал неправильный вывод.
Да, в последней итерации может и лучше кинуть всегда, хотя это маленький импрув, т.к. там обычно сотни и тысячи итераций делается, плюс в реальной жизни ты не знаешь когда последняя итерация (да и в этих играх я думаю тоже). Но самое главное, из этого не следует, что ты (или твой оппонент) должен кидать в предпоследней.
Там нет никакой репутации в обывательском понимании этого слова. Если ты кинешь случайным образом посредине игре, но следующем ходом сотрудничаешь, то зуб-за-зуб продолжит далее сотрудничать, не смотрю я на твою "испорченную репутацию".
Вообще, там есть более продвинутые стратегии, чем зуб-за-зуб, которые обычно чуть лучше выступают, но зуб-за-зуб самая простая из эффективных.
If the game is played exactly N times and both players know this, then it is always game theoretically optimal to defect in all rounds. The only possible Nash equilibrium is to always defect. The proof is inductive: one might as well defect on the last turn, since the opponent will not have a chance to later retaliate. Therefore, both will defect on the last turn. Thus, the player might as well defect on the second-to-last turn, since the opponent will defect on the last no matter what is done, and so on. The same applies if the game length is unknown but has a known upper limit.
...
For cooperation to emerge between game theoretic rational players, the total number of rounds N must be random, or at least unknown to the players. In this case 'always defect' may no longer be a strictly dominant strategy, only a Nash equilibrium. Amongst results shown by Robert Aumann in a 1959 paper, rational players repeatedly interacting for indefinitely long games can sustain the cooperative outcome.
БоевойСлон @ 18.12.2016
Ты можешь сформулировать это же утверждение, не используя слово "рациональное"? Почему ты приравниваешь единственное равновесие Нэша к "рациональному поведению"?
БоевойСлон @ 18.12.2016
В каком определении рациональности сказано, что рациональный игрок должен следовать равновесию Нэша, если его жизненный опыт говорит ему, что оппонент этому равновесию следовать не будет, и следовательно оптимальная для игрока стратегия будет другой?
БоевойСлон @ 18.12.2016
1) Каждому выгодно наказывать других за нарушение его интересов - это подаёт сигнал остальным, что не надо этого делать, пусть ищут себе другую жертву
БоевойСлон @ 18.12.2016
Но когда ты от генов переходишь к людям, ты почему-то отказываешь этому механизму в праве на эффективность
ZiingRR @ 18.12.2016
Thus, the player might as well defect on the second-to-last turn, since the opponent will defect on the last no matter what is done, and so on
ZiingRR @ 18.12.2016
or at least unknown to the players. In this case 'always defect' may no longer be a strictly dominant strategy
ZiingRR @ 18.12.2016
For cooperation to emerge between game theoretic rational players, the total number of rounds N must be random, or at least unknown to the players
Nameless00 @ 18.12.2016
А к чему еще я должен приравнять равновесие Нэша в случае игры против неизвестного?
Иначе вся идея ГТО псу под хвост, против неизвестного играем по ГТО, пока не будет известно про эксполиты.
Nameless00 @ 18.12.2016
Но люди так не делают. Люди какое-то количество раз передают ход и только тогда у них возникает мысль что пора бы и побеждать. Люди, в буквальном смысле, торгуются со своей совестью, где на одной чаше весов ощущение собственной справедливости, а на другой сумма денег и риск потери.
И есть пороговое значение. Обусловленное, заметим, сугубо эмоциями.
Nameless00 @ 18.12.2016
Опять же проиллюстрирую это для начала игрой.
Два незнакомых друг с другом человека, на кону сумма денег, ходят по очереди, количество ходов конечное и известное всем заранее.
В свой ход ты можешь забрать деньги себе и тогда оппонент не получит ничего, или передать ход и тогда сумма денег на кону возрастет.
И уже оппонент будет решать, забирает он деньги или передает ход.
Наиболее рациональное и вообще единственное рациональное поведение тут - забирать деньги на первом ходу. Любое другое поведение ущербно (ну если мы не можем сговориться с оппонентом).
A rational player is one who chooses his action, si ∈ Si , to maximize his payoff consistent with his beliefs about what is going on in the game.
Nameless00 @ 18.12.2016
А к чему еще я должен приравнять равновесие Нэша в случае игры против неизвестного?
Иначе вся идея ГТО псу под хвост, против неизвестного играем по ГТО, пока не будет известно про эксполиты.
Nameless00 @ 18.12.2016
БоевойСлон, вот тебе другой подход к тому же вопросу.
В обществе гуннов не выгодно быть художником или философом. Ты слишком слаб для того, чтобы претендовать хоть на что-то и вообще делаешь странное. Не видать тебе ни баб ни рейтинга ни богатств.
В Римской Империи времен заката не выгодно быть воином, ты слишком груб и уныл, для того чтобы претендовать хоть на что-то и вообще занимаешься фигней вместо искусств и философии. Не видать тебе ни достойных женщин, ни уважения.
Но при этом общества, которые тотально теряют своию ученых/воинов, проигрывают на следующем цикле истории, когда условная ценность сословия меняется.
Нерационально (невыгодно для тебя лично) быть гуннским философом или позднеримским воином, но рационально (выгодно) для общества в целом этих ущербов иметь и терпеть.
Если бы каждый имел возможность лично принимать рациональное осознанное и персонально выгодное решение - это приводило бы к вымиранию невыгодных каст и последующему вымиранию однобоких сообществ.
Но, к счастью, мы такой возможности не имеем.
Nameless00 @ 18.12.2016
Поэтому я и отказыввю этому механизму в праве на эффективность.
Поту что даже в реципрокном сообществе выгодно (рационально/правильно) быть эксплуатирующим эгоистом и невыгодно быть Недом Старком.
Но при этом сообщества эгоистов, не имеющие своих Недов Старков, тупо вымирают или не достигают тех успехов которых достигают сообщества менее рациональных агентов.
Nameless00 @ 16.12.2016
Возьмем сто раз обсосанную дилемму заключенного, как пример игры с ненулевой суммой.
Каждому поодиночке выгодно предать, но для обоих вместе выгодно сотрудничать.
В случае если проводится только одна сессия игры: ответ однозначный - предавать.
В случае же если проводится ряд сессий, то побеждают сотрудничающие, и умеренно злопамятные стратегии. То есть те, кто кооперируются если их не кидают, но мстят если их кидают.
Именно этот выход и отыскала эволюция для растущих сообществ наших предков (да и для многих других сообществ тоже, схожее поведение отмечено у волков, дельфинов и многих других стайных животных).
Изначально мы настроены сотрудничать, до тех пор пока не получим подтверждения что с этим конкретно типом сотрудничать не стоит, он уже пятый раз в арбитраже.
....
И мы поступаем альтруистично, потому что это повышает нашу репутацию и обеспечивает в будущем доступ к большему количеству возможностей среди людей, тех самых, которые точно так же как мы поступают, реагируют и оценивают.
We can now see that the organism and the group of organisms are true rivals for the vehicle role in the story, but neither of them is even a candidate for the replicator role. The controversy between ‘individual selection’ and ‘group selection’ is a real controversy between alternative vehicles...As it happens the outcome, in my view, is a decisive victory for the individual organism. The group is too wishy-washy an entity
Потому что даже в реципрокном сообществе выгодно (рационально/правильно) быть эксплуатирующим эгоистом и невыгодно быть Недом Старком.
Но при этом сообщества эгоистов, не имеющие своих Недов Старков, тупо вымирают или не достигают тех успехов которых достигают сообщества менее рациональных агентов.
ConstOr @ 18.12.2016
вот тут вроде ошибка. Там не strictly dominant, а rationalizable. То есть это работает, когда оба агента рациональны и это common knowledge.
Понятно, что в любом жизненном примере у нас не такая ситуация.
То есть и стратегия зуб-за-зуб хорошая в большинстве сценариев, но не во всех. Допустим если все наши оппоненты всегда предают (а это Нэш эквилибриум!), то зуб-за-зуб всем им проиграет, т.к. подразумевает сотрудничество на первом ходе.
Ты похоже не понял как это работает и сделал неправильный вывод.
Да, в последней итерации может и лучше кинуть всегда, хотя это маленький импрув, т.к. там обычно сотни и тысячи итераций делается, плюс в реальной жизни ты не знаешь когда последняя итерация (да и в этих играх я думаю тоже). Но самое главное, из этого не следует, что ты (или твой оппонент) должен кидать в предпоследней.
Там нет никакой репутации в обывательском понимании этого слова. Если ты кинешь случайным образом посредине игре, но следующем ходом сотрудничаешь, то зуб-за-зуб продолжит далее сотрудничать, не смотрю я на твою "испорченную репутацию".
Вообще, там есть более продвинутые стратегии, чем зуб-за-зуб, которые обычно чуть лучше выступают, но зуб-за-зуб самая простая из эффективных.