|
Дэвид Склански: Простая GTO игра Нормана Заде
Простая GTO игра Нормана Заде, Часть 1
Задолго до появления нового поколения игроков существовала книга о покере, в основе которой лежало широкое использование Теории Игр. Написана она была Норманом Заде и называется «Выигрышные Покерные Системы». Книга не стала популярной и читаемой в широких кругах, поскольку в основном рассматривала вопросы, связанные с игрой в лимитный лоуболл с одним обменом, а также и потому, что в то время было очень много слабых игроков и Теория Игр не являлась лучшим инструментом для получения их денег.
Тем не менее, ближе к концу повествования, в этой книге появляется короткое эссе, тема которого может быть применена ко всем разновидностям покера. Речь идет об упрощенной ситуации игры в хедз апе, когда Заде рассчитывает идеальную GTO стратегию для обоих игроков (прим. ред. GTO – Game Theory Optimal – Теория Оптимальной Игры). Исходные условия таковы: есть всего один раунд ставок перед вскрытием, оба игрока уже вложили в банк по 1 доллару и ставка в этом финальном раунде равна 2 доллара, при этом стек одного из игроков также равен 2 доллара. Т.е. если в этом раунде будет ставка, то она будет равна размеру пота и рейзы в этом раунде невозможны. Также в этом раунде противники могут сыграть чек-чек.
В приближенных расчетах, округлённых в этой статье, Заде выяснил, что первый игрок будет ставить с 14% лучших рук, со следующими 36% сыграет чек-колл, 43% еще более слабых рук уйдут в чек-фолд и ставка в блеф от него последует с 7% худших рук. При этом его оппонент сделает колл на ставку с лучшими 50% своих рук.
Если первый игрок чекает, то его противник будет ставить сам с 30% лучших и 15% худших рук, а остальные 55% рук сыграет чек бихаинд.
Это не абсолютно идеальное решение, но любой, кто знаком с Теорией Игр, легко может заметить, что предложенная стратегия в целом согласуется с GTO для пот лимитных игр. К примеру, частота блефа в 2 раза ниже частоты велью бета и если второй игрок ставит в блеф с нижней частью своего диапазона, то выигрывает немного чаще, чем проигрывает.
Еще один способ в подтверждение того, что эта стратегия находится рядом с Теорией Оптимальной Игры, показывает что произойдет, если один из игроков значительно отклоняется от нее. Во второй части этой статьи я докажу, что отклонения от этой стратегии ухудшают нашу игру. Кроме того, это также опровергнет распространенное заблуждение о том, что использование GTO не может сделать нашу игру прибыльной, а только лишь гарантирует ее безубыточность. (Некоторые люди обвиняют меня за это заблуждение, т.к. несколько лет назад я описал последний раунд торговли в игре, когда один из игроков блефует или же играет исключительно с натсами. В этой ситуации, если один игрок играет по GTO, стратегия другого не имеет значения, и он всегда будет делать одинаково хорошие ходы. Однако это частный случай).
Прежде чем я покажу, что отличные от GTO стратегии проигрывают стратегии Заде (хотя если вы в позиции второго игрока, они все еще могут выигрывать), рассмотрим, как вычислить EV руки для каждого игрока. (прим. ред. EV - Expected Value – ожидаемая прибыль, иными словами говоря математическое ожидание, не путать с эквити – Equity, которое многие, обозначают сокращенно также через EV). Для того чтобы сделать это, вы должны разбить расчет на несколько частей.
Если спектр игрока А топ 14% рук и игрока В топ 14%, то игрок А делает ставку, получает колл и в среднем это будет безубыточная ситуация. Это произойдет в 1,96% случаев и EV(А)=0
Если спектр игрока А топ 14% рук, а игрок В имеет следующие 36% лучших рук спектра (между 14% и 50%), то игрок А, делая ставку и получая в ответ колл от игрока В, выигрывает 3 доллара. Это 5,04% случаев и ЕV(А)=0,1512
Если спектр игрока А топ 14% рук, а игрок В с худшими 50% рук, то игрок А делает ставку, не получает колл в ответ и соответственно выигрывает 1 доллар. Это произойдет в 7% случаев и EV(A)=0,07
Если спектр игрока А между 14% и 30% лучших рук, а игрок В с топ 14% рук, то линия игрока А чек-колл и он проигрывает 3 доллара. Это 2,24% случаев и ЕВ(А)= –0,0672
Если спектр игрока А между 14% и 30% лучших рук, и игрок В имеет такой же спектр между 14% и 30%, то игрок А делает чек-колл и делит банк с игроком В. Это случается в 2,56% всех ситуаций и ЕV(А)= 0
Если спектр игрока А между 14% и 30% лучших рук, а спектр игрока В между 30% и 85% рук, то игрок А делает чек и, получив в ответ чек выигрывает 1 доллар. Это 8,8% случаев и ЕV(А)= 0,088
Если спектр игрока А между 14% и 30% лучших рук, а игрока В между 85% и 100%, то игрок А коллирует ставку в блеф от игрока В и выигрывает 3 доллара. Это случится с вероятностью 2,4% и EV(A)=0,072
Если спектр игрока А между 30% и 50%, а игрока В топ 30%, то игрок А делает чек-колл и проигрывает 3 доллара. Это 6% случаев и EV(A)= –0,18
Если спектр игрока А между 30% и 50%, и игрока В между 30% и 50%, то мы получим чек-чек и в среднем безубыточную ситуацию для обоих игроков. Это 4% случаев и EV(A)= 0
Если спектр игрока А между 30% и 50%, а игрока В между 50% и 85%, то противники сыграют чек-чек и игрок А выиграет 1 доллар. Это 7% случаев и EV(A)= 0,07
Если спектр игрока А между 30% и 50%, а игрока В между 85% и 100%, то игрок А делает чек-колл, ловит блеф игрока В и выигрывает 3 доллара. Это 3% случаев и EV(A)= 0,09
Если спектр игрока А между 50% и 85%, а игрока В топ 50% или худшие 15%, то мы увидим в игре чек-чек или чек-фолд и игрок А проигрывает 1 доллар. Это 22,75% случаев и EV(A)= –0,2275
Если спектр игрока А между 50% и 85%, и игрока В между 50% и 85%, то мы увидим в игре чек-чек и раздел. Это 12,25% случаев и EV(A)= 0
Если спектр игрока А между 85% и 93%, он всегда будет проигрывать 1 доллар, при этом иногда сыграв чек-фолд против ставки в блеф от игрока В. Это случится в вероятностью 8% и EV(A) = –0,08
Если спектр игрока А худшие 7% рук (ниже 93%), а игрока В топ 50%, то игрок А блефует и проигрывает 3 доллара. Это 3,5% случаев и EV(A)= –0,105
Если спектр игрока А худшие 7% рук (ниже 93%), а игрока В худшие 50% рук, то игрок А блефует и выигрывает 1 доллар, когда противник фолдит. Это 3,5% случаев и EV(A)= 0,035
Теперь нам надо просуммировать данные. Положительная часть +EV(A) = 0,5762:
0,1512+0,07+0,088+0,072+0,07+0,09+0,035=0,5762
Отрицательная часть -EV(A)= –0,6597:
–0,0672–0,18–0,2275–0,08–0,105=–0,6597
Итоговый результат равен для EV(A)=0,5762–0,6597=–0,0835
Иными словами говоря, игрок принимающий решение первым в среднем проигрывает более 8 центов каждую руку.
Автор: David Sklansky
Перевод: DeWashington
|