В 1998 году произошло открытие первого сетевого покер рума «Planet Poker», а уже сегодня тысячи зрителей по всему миру имеют возможность наблюдать противостояние профессиональных игроков и беспринципной машины. Несколько дней назад в блоге Нолана Далла появилась новость о том, что лучшие игроки в дисциплине NL HU Дуглас Полк и Донг Ким, не жалея сил и времени, тестируют покерного бота. Далее запись поспешно удалили, но всё, что в ней было сказано, вчера воплотилось в реальность.

Старт битвы в Rivers Casino

4 профессионала в лице Дугласа Полка, Донга Кима, Бйорна Ли и Джейсона Леса согласились проверить на прочность бота Claudico, созданного силами учёных из Университета Карнеги-Меллон. А чтобы мотивировать ребят, организаторы приготовили небольшой приз в $100,000 и, конечно же, почасовую оплату. Эксперимент продлится 2 недели, в течение которых все игроки сыграют против Claudico по 20,000 раздач. Каждый день профи будут транслировать свои попытки обыграть искусственный интеллект на Twitch.tv.

WCGRider vs Claudico

Сможет ли Claudico повторить успех грозы лимитного холдема Cepheus - узнаем совсем скоро. А пока можно отслеживать успехи этого бескомпромиссного матча в социальных сетях по тегу #brainsvsai, на странице проекта и на сайте Rivers Casino. Во время трансляций бот будет использовать вычислительные мощности суперкомпьютера Blacklight в Питтсбурге.

Blacklight

По словам учёных, Claudico был построен с использованием алгоритмов, которые анализируют основные правила игры в покер, чтобы разработать выигрышную стратегию, а не пытаться повторять трюки и стратегии профессиональных игроков.

Brain Team

Запись матча - WCGRider vs Claudico

Аналитика машинного ГТО

Бубны Немного аналитики от пользователя Uran, который более 10 лет изучает машинное гто:

Что касается моих предположений. Скорее всего, на суперкомпьютере рассчитали абстрагированную ха модель для 200бб стеков и кучи сайзингов. Потом сохранили ее на диске с обрезанным ривером (так как с ривером там будут пентабайты стратегии). Прога на ривере долго тупит, скорее всего считает в реальном времени, попутно выдергивая из предпросчитанной стратегии ранних улиц свои "диапазоны".

Напишу немного про сторону оппонентов, так как живые игроки в представлении не нуждаются. Туомас Сэндхолм держит лабу в университете Питтсбурга. Покером занимается более 10 лет, первый успех был в решении Rhode Island Hold'em (упрощенная версия FL HU, тем не менее очень большая для алгоритмов того времени) с помощью алгоритмов градиентного спуска, адаптированных к решению игр с неполной информацией. Долго мучил линейную алгебру, сейчас уже перестал; писал неплохих ботов серии GS, потом переименованную в Tartanian, последний из которых занял первое место в NL HU соревновании ботов прошлого года.

Вообще фин, конечно, устроил большую пиар-акцию из всего этого дела, но учитывая, что на постфлопе у него есть довольно много абстракций, то, скорее всего, профессионалы легко обыграют бота. Скорее всего, от 20бб/100+ минимум. В 100бб стеках. При этом интересно послушать и посмотреть на Райдера.

Чтобы понизить диспу, используются зеркальные матчи, когда для двух пар зеркально меняют карманные карты, а доску оставляют одинаковой. Насколько я понял, для Полка зеркало это Ким.

Жалко создателя. Он же ученый, думал, если его бот порвал в состязании других ботов на 10бб/100, то если его еще подрасчитать, то он и людям конкуренцию составит. А тут прямо без шансов разрыв. Но, я думаю, матч имеет важное значение для покерной индустрии. Так как если игроки разорвут в хлам топового хапного бота, это несколько уменьшит состояние бота паранойи.

Бубны Ссылки по теме:

Бубны Twitch.tv Brain Team: