Мир искусственного интеллекта, кажется, никогда еще не развивался так стремительно, как за последние несколько лет. В связи с этим в покерной индустрии все чаще возникает вопрос: когда ИИ станет достаточно умным, чтобы стабильно обыгрывать человека?
Первые серьезные противостояния между реальными людьми и обученными ботами начались еще в 2019 году. Тогда модель Pluribus обыграла команду профессионалов, став первым ИИ, добившимся такого результата. А в прошлом году девять ботов провели между собой почти 4,000 раздач, чтобы определить сильнейшего. В итоге модель OpenAI o3 вышла победителем, а LLAMA 4 ушла в минус. Теперь же на вершине появился новый лидер.
Речь идет об ИИ-агенте, который стал основой кастомных решений платформы GTO Wizard. В отличие от универсальных моделей, он создавался именно для покерных задач. Изначально технология разрабатывалась как Ruse AI канадскими программистами Марком-Антуаном Прово и Филиппом Бирдселлом, но в 2023 году многообещающий проект перекупил GTO Wizard.

В отличие от более ранних ботов, таких как Slumbot (чемпион Annual Computer Poker Competition), которые опирались на заранее просчитанные стратегии, GTO Wizard AI не хранит готовые решения на все случаи жизни. Модель обучалась, играя сама против себя сотни миллионов раздач. Таким образом она постепенно определяла, какие действия дают максимальное EV.
По заявлению разработчиков, благодаря методу глубокого обучения с подкреплением модель анализирует каждую конкретную ситуацию прямо во время игры и находит оптимальное решение за считаные секунды.
Этот подход подтвердил свою эффективность в матче против Slumbot на дистанции 150,000 раздач: GTO Wizard AI показала винрейт 19.4 ББ/100. Для сравнения: топовые профессионалы обычно ориентируются на ~5 ББ/100. Если перевести это в деньги при лимитах $50/$100 и темпе 200 раздач в час, это примерно $3,880 в час.
Slumbot — не единственный «соперник», с которым сразилась GTO Wizard AI. Новый бенчмарк впервые сравнил выдающиеся LLM-модели с узкоспециализированным покерным агентом. Результаты показали, что, несмотря на прогресс в логике и рассуждениях, универсальные модели все еще сильно уступают в стратегической глубине.
| Место | Модель | Компания | Винрейт (ББ/100) | Раздачи |
| 1 | GPT-5.3 (XHigh Reasoning) | OpenAI | –16 | 5,000 |
| 2 | Marvel | MIT | –14 | 5,090 |
| 3 | GPT-5.4 (XHigh Reasoning) | OpenAI | –17.8 | 5,000 |
| 4 | GPT-5.3 (High Reasoning) | OpenAI | –18.2 | |
| 5 | Claude Opus 4.6 | Anthropic | –20.4 |
Даже лучшие ИИ уходят в минус против специализированного агента. OpenAI: GPT-5.3 остается лидером среди универсальных моделей, но все равно уступает GTO Wizard AI с результатом –16.0 ББ/100. Claude Opus 4.6 (–20.4 ББ/100) и Gemini 3.1 Pro (–30.8 ББ/100) показывают, что даже продвинутые ИИ с развитым логическим мышлением испытывают серьезные трудности с безлимитным Холдемом.

Grok 4 от xAI Илона Маска находится значительно ниже и даже не попал в лидерборд с винрейтом примерно –60 ББ/100 с поправкой на удачу. Вывод очевиден: универсальный ИИ пока не способен конкурировать с покерными решениями.
Покер — игра с высокой дисперсией, и для достоверных выводов обычно требуется огромная дистанция. В проведенном тесте использовалась технология AIVAT, которая снижает влияние удачи примерно в 10 раз. Это позволило получить статистически значимые результаты при гораздо меньшем количестве раздач.
Создатели GTO Wizard открыли API для разработчиков и исследователей, позволив им отправлять собственные модели на тестирование. Этот шаг направлен на развитие более прозрачной конкуренции в области ИИ.
API позволяет разработчикам проводить тестовые раздачи с участием их собственных агентов и получать точные результаты. При этом внутренние механизмы солвера GTO Wizard остаются им недоступны. Условия испытаний:
Следующий шаг — переход к бенчмаркам в хедз-апе PLO. Но главный вывод уже очевиден: в эпоху развитого ИИ недостаточно просто заявлять о том, что та или иная модель может обыграть человека, — необходимо доказывать это фактами и цифрами в лидербордах.

Хотите поделиться своим мнением или оставить комментарий?
Написать