Цитата
если коллер пренебрегает рейком и коллирует в рейковой среде как в безрейковой, предпочитая проигрывать деньги заведению
я не уверен, что это правильная формулировка в принципе
у нас есть условия. Рейк часть условия.
У нас есть сбалансированное дерево решений, приближенное к оптимальному. У оппонента есть такое же дерево решений
Когда один отклоняется, второй зарабатывает. Если оппонент не учитывает рейк в своем дереве решений, он уже отклоняется от оптимального в текущих условиях.
Существует ли стратегия для агрессора лучше Нэша? Окей, давай просто сформулируем по другому. Сперва уточню: лучше = более прибыльная. Существует ли более прибыльная стратегия, чем приближенная к идеальной оппонентонезависимой, когда наш опп коллит больше чем должен? О, даже давай просто еще утолстим эту тему: существует ли стратегия лучше Нэша когда опп коллит 100%? Разумеется, на этот вопрос ты знаешь ответ, и этот вопрос о том же самом, о чем спросил ты, они кажутся разными, потому что у них разное масштабирование). Эксплойт отклонения оппа будет более прибыльным, само собой
А теперь подытожу. Во первых, деньги от ошибки идут не заведению, деньги идут агрессору и заведению. Во-вторых, задавая вопрос об оппонентонезависимой модели, ты сам же выводишь вопрос из плоскости этой модели - потому что искомое тобой лучшее уже находится за пределами модели в виду того, что ты добавил учет дополнительных факторов, в то время как создается впечатление, что ты спрашиваешь о лучшем среди оппонентонезависимых древ решений
Если ты пытаешься сравнить эксплойт и оппонентонезависимые стратегии, то это тоже не стоит делать. У них немного разное назначение в теоретическом смысле
(1) Ну вот например, какое предположение будет правильным - что в моем кармане лежит десятибаксовая купюра или что не лежит? При условии, что я задаю этот вопрос без привязки к ее наличию там - а так оно и есть, вопрос задан в виду написания этого сообщения. Корректным будет сказать, что скорей всего ее там нет. Ну, существует достаточно низкая вероятность совпадения, что я внутри этого контекста задам этот вопрос, и при этом одновременно будет лежать банкнота в кармане, да еще не любая, а довольно конкретная банкнота. Это предположение для всех карманов в мире будет отличным и будет давать верное предсказание с достаточно серьезной частотой
(2) Окей, теперь ты допустим знаешь, что я живу в США (не я сказал, а ты это знаешь, ну чтобы не добавлять сюда вероятность, что я могу солгать, и не усложнять без надобности текст). Байесова вероятность этого повысилась, потому что соотношение карманов в этом регионе со всеми десятидолларовыми банкнотами выше, чем в среднем по миру. Это уже не кармано-независимо, потому что ты учел дополнительные знания, которые не входили в основную модель. При этом вероятность, что в моем кармане лежит эта банкнота по-прежнему недостаточно высока, и лучше будет действовать так, как если бы ее там не было.
(3) Но допустим, ты видел, как я положил туда банкноту совсем недавно. Оу, вот теперь байесова вероятность выше, и мы уже можем всерьез рассматривать предположение, что эта банкнота там есть, хотя абсолютно точно ты этого не знаешь (я могу быть еще тем трюкачем, или просто я переложил ее в другой карман, когда ты отворачивался минуту назад, но обычно люди не вытворяют таких номеров с банкнотами без веских на это причин). И это понятно что тоже не карманонезависимо)). Но будет очень большой глупостью строить свои предсказания, игнорируя уже известный тебе пласт информации. Ты просто будешь выносить верные предсказания гораздо реже, чем мог бы их выносить, если бы учитывал эту дополнительную информацию. Кармано-независимая рассматривает средне-мировой карман, но теперь для твоей области знаний мой карман не является средне-мировым. Но это не значит, что кармано-независимая модель бесполезна. Ты можешь по-прежнему делать по ней хорошие предсказания, когда у тебя нет дополнительной информации
Кроме того, есть еще одна практическая польза от знания кармано-независимой модели - когда ты имеешь доп. информацию, ты можешь оценить, насколько мой карман отличается от среднего) Это может помочь с оценкой своих решений, связанных с моими карманами) Мне кажется на этом должно быть довольно удобно завязывать навык карманных решений
Вот такие дела. Не знаю, хотел ли ты это прочесть, но я захотел это написать (и вежливо спрятал под спойлер)
Кстати, вопрос про рейк и коллы - так на глаз возможно он ближе где-то к (2) по степени влияния на наши решения (но это не факт)
Вопрос: если коллер пренебрегает рейком и коллирует в рейковой среде как в безрейковой, предпочитая проигрывать деньги заведению, а не противникам за столами, получается, стратегия агрессора предложенная солвером, может быть хуже другой стратегии? И тогда солвер неспособен посчитать оптимальную стратегию, а раз так, то мы приходим к известным выводам о том, что же такое солверы?
Или же что-то неправильно насчитали/нужно использовать другой солвер?