Теория игр

Последний пост:08.12.2023
937
Статистика
Всего постов
1312
666,320 просмотров
Новых постов
+0
0 в день
Лучшие посты автора
17.10.2017 +295
25.06.2018 +216
19.10.2017 +207
21.10.2017 +202
02.07.2018 +201
Лучшие посты читателей
TylerRM +213
mikado +140
sweetcoqueta +124
Soul +105
feruell +96
Самые активные читатели
1 7 8 9 10 29 66
  • Интересный получился момент, на примере ответов, например моего(в сравнении с правильным)
    Цитата (Redizz @ 19.10.2017)
    Т.к. опп обязан ставить 50% камень мы убираем эту часть из стратегии, ведь она бьется бумагой. Итого выходит что в остальных 50% мы ставим камень, ножницы и бумагу в равных пропорциях по 16,6%.

    Стратегия выходит такая:
    Бумага - 66,6%
    Камень 16,6%
    Ножницы 16,6%


    на практике видно как гто уничтожает плюсовую интуитивную стратегию
    Сообщение отредактировал Redizz - 20.10.2017, 13:06
    2/2
    Ответить Цитировать
    1
  • Эта мини игра с Камень,ножницы,бумага называется Toy game - очень упрощенная игра с простым решением. Однако ее концепции могут быть применены и в более сложных играх.
    Сам подход к решению этой игры наззывается "минимальный эксплойт".Попытаюсь обьяснить, чем он отличается от "максимального эксплойта" на примере.
    С ранней позиции открылся фиш и рег на катоофе его 3-бетнул. Вы точно знаете ,что он его 3-бетит лузовее чем должен, чтоб заизолейтить фиша( Фиш лузово-пассивный, часто отваливается, плохо играет постфлоп).
    Вы сидите на батоне. Логично, что вы бы хотели 4-бетить, против такого 3-беттора лузовее, чем вы бы обычно это делали. Разберем два подхода.
    1) Макс. Эксплойт - Вы знаете что в диапазоне соперника больше слабых рук чем должно быть , и рассчитываете что он их все выкинет. Соответсвенно, вы расширяете свой 4-бет, добавляя туда больше блефов, оставляя при этом столько же вэлью.
    Но теперь ваши стратегия тоже очень несбалансированная и вы сами подставляетесь под эксплойт. Рег может понимать что вы 4-бетите его лузовее, и широко 5-бет пушить. Если это происходит то ваш макс.эксплойт страта играется в жесткий минус, и для вас было бы плюсовее не меня свою стратегию вовсе.
    2) Минимальный эксплойт. - Вы знаете что в диапазоне соперника больше слабых рук , чем должно быть. Как следствие теперь вы можете 4-бетить тоньше на вэлью и колить 5-бет, так как ваш рэндж имеет больше эквити чем раньше.
    Как следствие этого, теперь вы можете больше блефовать, так как в вашем рэндже стало больше вэлью. Тоесть если вы добавили 6 вэлью комб, то можете добавлять 3 комбо блефов( в зависимости от вашего сайза).
    Теперь у Villain нету опции контр эксплойта вас. Если он много 5-бетит в блеф(или лузовее колит), то ваши вэлью зарабатываю больше денег, а блефы теряют, но вэлью у вас в 2 раза больше. Собсвенно ЕВ вашей страты стало больше чем было.
    Если он наоборот оверфолдит, то ваши тонкие вэлью теряют деньги коля 5-бет, но вы компенсируете это тем что теперь вы начали больше блефовать. Поэтому не важно как он будет реагировать, вы точно зарабатываете больше чем при вашей дефолтной страте.
    Единственная его опция вас законтрить, это перестать так лузово 3-бетить фиша. Однако это этот эксплойт гораздо сложнее сделать чем тупо реагировать в плоскости - "Много фолдят -много блефую, мало фолдит - мало блефую".

    Выводы - Макс эксплойт может дать вам возможность заработать намного больше денег, но дает сопернику опцию вас еще сильнее законтрить.
    Минимальный эксплойт дает вам меньшую прибыль, но при этот он ее гарантирует, и у соперника нету контр-эксплойта. Чтоб подстроиться, ему надо изменить свою стратегию в корне, а не менять последнюю ветку решения.

    Против регов с техническими дырами в игре советую юзать минимальный эксплойт, против фишей - макс. эксплойт.
    Если что-то неясно объяснил, плиз пишите - Я постараюсь разъяснить.
    29/263
    Ответить Цитировать
    142
  • Цитата (EyeShield77 @ 19.10.2017)
    Мы играем 1/3 камнем, 2/3 бумагой. ЕВ 1/6, соперник играет 2/3 своего свободного выбора ножницами, 1/3 бумагой (т.е. в общем у него 1/2 камня, 1/3 ножниц, 1/6 бумаги).

    Старз: EyeShield77

    Объяснение: мы не имеем права использовать ножницы, так как их ЕВ нулевое в лучшем случае. Учитывая это, в свободном выборе соперника ЕВ от камня нулевое в лучшем случае, и он не имеет права использовать его. Дальше сопернику необходимо сделать так, чтобы ЕВ нашего хода бумагой или камнем было одинаковым, а нам так, чтобы ЕВ его хода бумагой или ножницами было одинаковым. Это получается в указанном мной ответе.

    Если в цифрах, то пусть мы ходим в x случаев камнем, (1-х) бумагой. Соперник ходит b случаев бумагой, (0.5-b) случаев ножницами. Наше

    ЕВ = x (0 ев от ничьи с камнем + (0.5-b) ев от выигрыша у ножниц - b от проигрыша бумаге) + (1-x)*(0.5 от выигрыша у камня в 50% случаев + 0 от ничьи с бумагой - (0.5-b) от проигрыша ножницам) = после упрощения

    x(0.5-3b) + b или b(1-3x)+0.5x

    Отсюда видим, что нам, чтобы нивелировать b, нужно ставить x=1/3. Сопернику, чтобы не потерять ЕВ от изменения х, нужно ставить b=1/6.


    Кстати, замечу одну важную вещь, которая выполняется не только в указанном примере, но и в общем в теории игр. Когда вы ищете равновесие в смешанных стратегиях (т.е. используя не детерминированные действия, типа всегда бумага, а рандомизируете) ключевым моментом является то, что все действия между которыми вы рандомизируете должны вам давать одинаковое ожидание. В данном примере, что камень, что бумага дают одинаковое ожидание. Посколько ваше ожидание от конкретного действия зависит только от того, как рандомизирует оппонент, то исходя из этого условия, вы можете посчитать как будет рандомизировать оппонент в равновесии . То же самое верно для вашего оппонента. Все действия между которыми будет рандомизировать он, также должны давать ему одинаковое ожидание. Исходя из этого можно посчитать как должны рандомизировать вы.

    Можно убедиться, что во всех неправильных ответах, которые были предложены, предложенная рандомизация не дает одинакового ожидания от конкретных действий. В то же время в правильном ответе EyeShield77 все действия дают одно и то же ожидание, поэтому они и являются равновесными. То что мы нашли в данном примере, кстати, по науке называется не ГТО, а равновесие Нэша в смешанных стратегиях.
    4/6
    Ответить Цитировать
    11
  • nice2meet885, в случае с "камень, ножницы, бумага" - пример макс эксплойта будет 100% бумага? когда оп нас вычислит (если вычислит) то это будет контр эксплойт с его стороны. Правильно понимаю?
    1/7
    Ответить Цитировать
    2
  • Филипп, кого ты считаешь топ 5 лучших игроков в спин гоу на 100-м лимите?
    9/14
    Ответить Цитировать
    0
  • норм Айшилд заработал!!! пойдёт на лимит выше!
    1/4
    Ответить Цитировать
    12
  • Цитата (nice2meet885 @ 20.10.2017)
    Тоесть если вы добавили 6 вэлью комб, то можете добавлять 3 комбо блефов( в зависимости от вашего сайза).


    можешь по-подробнее объяснить?
    про зависимость количества блеф комб от сайза
    1/6
    Ответить Цитировать
    0
  • Xaka,
    Да, если ты считаешь что в оставшихся 50% он будет рандомить и делать каждое действие примерное 1/3. Тогда он примерное 66.6% показывает камень и офк самая плюсовая страта против его линии это всегда показывать бумагу.
    30/263
    Ответить Цитировать
    0
  • vitja11111,
    В примере я все сильно упростил, так как расчет идет префлоп и у нас не сказать что прямо супер полярный диапазон 4-бета. Если у 3-беттора только опция 5-бет пуша или фолда, то тогда можно четко рассчитать сколько нам нужно блефов на наши вэлью. Однако в реальности у катоффа есть опция кола или 5-бет не пуша.
    Это сильно усложняет наше уравнение, добавляя переменную "реализации эквити", то есть у нас нету строго блефов и вэлью - Типа как ББ против Батона в кэше 3-бетит 76 мастевые, но при этом колит их на 4-бет. 3бет с 76 явно не на вэлью, но и на 4-бет не фолдим.
    Но если коротко и не брать этого, то формула такая же , что и по риверу.
    Если мы ставим пот значит нам нужно что опп фолдил 50%. У оппа шансы 2 к 1 , что значит он должен выигрывать 33%, что означает у нас в бете должно быть 33% блефов и 66% вэлью. соотношение вэлью к блефам 2 к 1. Чем меньше сайзинг тем больше нам нужно вэлью, так как у соперника лучше шансы банка, и наоборот.
    31/263
    Ответить Цитировать
    9
  • Цитата (nice2meet885 @ 20.10.2017)
    Сам подход к решению этой игры наззывается "минимальный эксплойт".

    Выводы - Макс эксплойт может дать вам возможность заработать намного больше денег, но дает сопернику опцию вас еще сильнее законтрить.
    Минимальный эксплойт дает вам меньшую прибыль, но при этот он ее гарантирует, и у соперника нету контр-эксплойта. Чтоб подстроиться, ему надо изменить свою стратегию в корне, а не менять последнюю ветку решения.

    Против регов с техническими дырами в игре советую юзать минимальный эксплойт, против фишей - макс. эксплойт.
    Если что-то неясно объяснил, плиз пишите - Я постараюсь разъяснить.


    в чём тогда разница между мин эксплоитом и базовыми гто-решениями по солверам?
    2/11
    Ответить Цитировать
    0
  • Цитата (firearsenaloo @ 20.10.2017)
    в чём тогда разница между мин эксплоитом и базовыми гто-решениями по солверам?


    С мин эксплойтом ты будешь зарабатывать немного больше, чем по ГТО. При этом сопернику очень сложно заметить, что мы его эксплойтим, не говоря уже о по стройке контрстраты.
    1/8
    Ответить Цитировать
    2
  • Про той геймы вспоминается старая запись работы в кардраннере Филиппа с учениками. Тоже интересный разбор был)
    2/11
    Ответить Цитировать
    0
  • Цитата (firearsenaloo @ 20.10.2017)
    в чём тогда разница между мин эксплоитом и базовыми гто-решениями по солверам?


    в том то и дело, что это и есть ГТО против фиксированного (более лузового относительно ГТО и залоченного) диапазона оппа. Потому у оппа и нет контрэксплойта
    2/2
    Ответить Цитировать
    1
  • #96 Может FP или CFRM или CFR+ или я не понял вопрос.
    1/1
    Ответить Цитировать
    0
  • покер на покерном форуме, палехче парни
    1/1
    Ответить Цитировать
    30
  • nice2meet885, расскажи что ты изучал по теории игр? Книги,курсы и тп.
    1/1
    Ответить Цитировать
    -1
  • Цитата (firearsenaloo @ 20.10.2017)
    в чём тогда разница между мин эксплоитом и базовыми гто-решениями по солверам?


    МИн.Эксплойт и есть ГТО, при условия что одна или несколько веток решений залочена(не может быть изменена)
    32/263
    Ответить Цитировать
    2
  • Цитата (FunkeR @ 21.10.2017)
    nice2meet885, расскажи что ты изучал по теории игр? Книги,курсы и тп.


    Я не эксперт теории игр. В свое время я очень много Той Геймов в креве, пытаясь найти эквилибриумы самостоятельно, без помощи солверов.
    33/263
    Ответить Цитировать
    0
  • Продолжим рубрику за жизнь.
    Недавно посмотрел фильм "Shot Caller"
    Интересно было увидеть Джейми Ланнистера в новой роли). Фильм о том, как человек, случайно убивший друга в аварии отправляется в тюрьму. Там он присоединятеся к банде, чтобы выжить
    и как это меняет его жизнь. К слову это не спойлер, фильм снят так, что это ясно спустя 10 минут.

    После фильма задумался, зачем вообще нужна тюрьма? И справляется ли она с поставленной перед ней задачей?
    ИМХО цель тюрьмы, как социального института это - перевоспитать людей, которые отказываются следовать законам социума и эксплойтят других людей,в своих интересах.
    Я бы разделил преступнков на 3 группы.
    1) Люди, которые по-честному не думают, что они делают что-то плохое( Психически больные или совсем дети)
    2) Люди, которые либо совершили преступление неумышленно( Сбили кого-то на машине), либо вынужденно ( Человеку срочно нужны были деньги на операцию жены, и он решил ограбить магазин), при этом раскаиваются в содеянном.
    3) Люди, которые осознанно не следуют закону, из-за своих корытсных мотивов.(Наркодиллеры, мошенники)
    Понимаю, что порой сам по себе закон бывает несправедливым, но я бы хотел затронуть только аспект тюрем в этом посте. На сколько они справляются с перевоспитание этих трех групп, и как эту ситуацию можно улучшить?

    Мне кажется, что тюрьма не помогает ни кому из представителей этих трех групп.
    У подростков и душевнобольных намного больше шансов по статистике продолжить совершать преступления после выхода из тюрьмы. Они чувствуют себя чужими, среди "нормальных людей", многие вступают в банды. Общество ставит на них клеймо и им тяжело найти работу.
    Со второй группой ,та же история - Что собственно и случилось с главным героем фильма.
    Третья группа за частую не думает в формате - "Блин заниматься ГОп-стопом - реально плохо. Из-за этого я попал в тюрьму, и теперь раскаиваюсь.Как только выйду на свободу, никогда больше не буду этого делать"
    Часто они будут думать - "Заниматься Гоп-стопом возле трассы - плохая идея, так как там стоят камеры и поэтому меня поймали. Я извлек свой урок! Теперь , когда выйду - буду только воровать в темных переулках, чтоб больше не поймали."
    Типа ты попал в тюрьму, потому что тебя поймали, а не потому что ты сделал что-то плохое. Разводить лохов можно, главное делать это без кипиша.

    Что мне кажется, могло бы частично улучшить ситуацию.
    Я бы сделал систему наказаний полярной, и отказался бы от полумер. Цитируя Ганнибала Лектера - «в любом нормальном обществе меня либо убили бы, либо использовали во благо этого общества».
    1) Отказался бы от безумно долгих сроков по 10 лет. ИМХО именно из-за этого создается "тюремная субкультура".
    А)Если человек совершил что-то легкой категории - то он идет в исправительный лагерь для таких же как он на 1, максимум 2 года.
    Б)Из тяжелой категории, то его отправляют в место формата "Дисциплинарный Батальон", где как известно нету никакой дедовщины, и он считается в несколько раз хуже тюрьмы.
    Но максимальный срок тоже 1-2 года. Это дает людям возможность вернуться к своей семье и привычной им жизни, в то время как десятилетние срока реально оставляют пропасть между ними и реальным миром.
    В)К людям которые будут регулярно попадать в "Дисбат", или творитьт откровенную дичь( Типа насилие и убийство женщин), ничего кроме смертной казни я придумать не могу.
    Хоть это и звучит очень радикально, но для меня это как Бэтмен, который регулярно ловит Джокера и сажает его в Аркхэм, а тот 100500-ый раз убегает и вновь убивает сотни людей.
    Бэтмен опять его ловит, но не убивает, а вновь сажает, зная , что Джокера все-равно убежит.
    Виновен ли Бэтмен частично в смерти всех жертв Джокера, хотя мог все это предотвратить?

    Я искренне не знаю , как решить проблему с тюрьмами. То что я написал сверху является лишь моим мнением, и мне интересно послушать что думают другие люди, как можно разобраться с этой социальной проблемой.
    Буду рад любому фидбэку.
    34/263
    Ответить Цитировать
    52
  • Наша исправительная система - как демократия: мы юзаем её, потому что не придумали ничего лучше. Работает так себе, потому что больше борется с симптомами, а не причинами. Её плюс разве что в страхе людей перед законом, который не даёт обществу скатиться в полный дебош. И то это очень шаткая вещь, работающая лишь в относительно спокойное время. Что происходит во время войн и революций, даже среди гражданского населения, мы знаем не понаслышке.

    Всё должно начинаться с воспитания людей, создания условий и образа их жизни, которые вообще несовместимы с каким-либо криминалом. Довольному своей жизнью человеку он ни к чему.

    Снижение средних сроков и повышение неотвратимости наказания - краткосрочные заплатки, имхо. Попробовать и посмотреть, как пойдёт. Но на дистанции плюсовее создавать условия, при которых не будет самой проблемы преступлений/наказаний.
    1/3
    Ответить Цитировать
    20
1 7 8 9 10 29 66
1 человек читает эту тему (1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.