Насколько сильны боты в Лимитном Холдеме?

На TwoPlusTwo появился очередной топик, в котором опять обсуждается «решаемость холдема» (то есть, можно ли написать такого бота, который будет играть не меньше, чем в ноль). Началось всё достаточно безобидно, автор лишь вопросил, можно ли считать 6макс гипертурбо сателлиты (где у вас изначально 10 бб) решёнными… В этой статье также будут выложены мнения покеристов, игравших против ботов или имевших с ними дело в какой-то иной степени.

Maton808 шутливо подкинул дровишек в костерок, выложив график одного из самых известных 6макс сателлитчиков в мире Jorj95. Однако после этого разговор пошёл совсем в другом русле.

ohsosick, кажется, любит раскачивать лодку:

«Хедз-ап лимитного холдема уже решили в этом году. Безлимитный хедз-ап со стеками в 200 бб решён не до конца, однако лучший современный бот бьёт второго по силе с эджем в 0.3бб/100 на дистанции в миллион рук.

На протяжении ста тысяч рук один бот смог выиграть у другого всего лишь 670 блайндов. Они играют очень близко к нэшу.

6макс решить тяжелее, поскольку нужны большие вычислительные мощности».

На это ему, конечно, возразили, что преимущество одного сильного бота над другим совершенно не означает, что программа будет сильнее игроков.

В январе 2013 года прошла специальная конференция разработчиков покерных ботов, в ходе которого создатели Neo Poker Bot заявили, что они «якобы решили» лимитный хедз-ап холдем. Под «якобы решили», я понимаю здесь то, что они до конца просчитали «поиск по игровому древу». Это не «решение LHE», а несколько иной способ справиться с проблемами.

Shalako поделился своим опытом игры против NeoPoker Bot, но в безлимитный, а не лимитный холдем:

«Я сыграл против этого бота несколько сотен рук, и он абсолютно ужасен в безлимитном хедз-апе. Во-первых, я заметил, что он фолдит на трибет в 95% случаев. У него также отсутствует рендж колла 3бета, то есть он либо пушит, либо фолдит. Так что без позиции вам нужно просто трибетить каждую руку и падать на его олл-ин. Он рейзит порядка 90% батонов, так что трибет будет крайне эффективен. Я также рейзил 90% батонов, а его диапазон колла был достаточно типичен и предсказуем: бродвеи, одномастные тузы и так далее. Он 3бетит верхние 10%, а если стек меньше, то шире, конечно.

На постфлопе он слишком тайтов, и положить его на конкретный диапазон не составляет труда. Боту также трудно справиться с чек-рейзам и дабл/трипл-барелями. Если он рейзит, то у него как минимум две пары. Не встречал блеф-рейзов от него. Программа также не замечает разницы в размере ставок и не делает из этого никаких выводов.

Большинство ботов плохо справляются с агрессией, и этот не является исключением. Слабости программы стали очевидны после нескольких сотен рук.

Update: Сыграл ещё несколько сотен, и он наконец-то стал колировать мои трибеты, но не в достаточной мере, чтобы «убить» моё преимущество при 100% трибете. Я также увидел от него блеф-рейз на весь стек с нижней парой, что было достаточно интересным решением на той текстуре борда».

В топик на twoplustwo на коне врывается phd-студент по математике:

«Привет, котаны! Меня зовут Майк Йохансон, и я являюсь одним из тех, кто разработал Hyperborean и Polaris (одни из самых известных покерных ботов во Вселенной). Меня попросили отписаться в тредике, можно ли считать лимитный холдем решенный. Не читал весь ваш трэш, но всё равно слушайте.

Хедз-ап лимитный холдем не решён. Пару лет назад я писал, что мы можем определить, насколько бот близок к равновесию нэша, рассчитывая, как много он будет терять против превосходного противника. При настоящем равновесии Нэша потери будут составлять 0$ за игру. И чем меньше ваша эксплоитность, тем ближе вы к Нэшу.

В 2011 году я писал, что наши лучшие стратегии в 2008 году на соревновании «человек против машины» имели предел эксплуатируемости в 11.75ББ/100. Лучшие стратегии 2011 года держались лучше, их могли эксплоатить где-то 5ББ/100.

С того момента мы очень далеко продвинулись. Наш последний алгоритм, CFR-BR, позволяет нам ещё сильнее приблизиться к равновесию Нэша. В этом материале наша стратегия была эксплоитна на 2ББ/100. С того момента мы продвинулись ещё дальше, однако на соревнование новую разработку не отсылали. В университете мы очень близки к эквилибриуму, но ещё не дошли до него.