GTO Wizard AI превосходит GPT-5 и Grok 4

Бонус 250% для новичков по промокоду

Мир искусственного интеллекта, кажется, никогда еще не развивался так стремительно, как за последние несколько лет. В связи с этим в покерной индустрии все чаще возникает вопрос: когда ИИ станет достаточно умным, чтобы стабильно обыгрывать человека?

Содержание:

Что такое GTO Wizard AI
Новый покерный AI-бенчмарк
Брось вызов GTO Wizard: доступ к API открыт

Первые серьезные противостояния между реальными людьми и обученными ботами начались еще в 2019 году. Тогда модель Pluribus обыграла команду профессионалов, став первым ИИ, добившимся такого результата. А в прошлом году девять ботов провели между собой почти 4,000 раздач, чтобы определить сильнейшего. В итоге модель OpenAI o3 вышла победителем, а LLAMA 4 ушла в минус. Теперь же на вершине появился новый лидер.

Что такое GTO Wizard AI

Речь идет об ИИ-агенте, который стал основой кастомных решений платформы GTO Wizard. В отличие от универсальных моделей, он создавался именно для покерных задач. Изначально технология разрабатывалась как Ruse AI канадскими программистами Марком-Антуаном Прово и Филиппом Бирдселлом, но в 2023 году многообещающий проект перекупил GTO Wizard.

ИИ-бот ГТО — Результаты GTO Wizard AI против Slumbot

В отличие от более ранних ботов, таких как Slumbot (чемпион Annual Computer Poker Competition), которые опирались на заранее просчитанные стратегии, GTO Wizard AI не хранит готовые решения на все случаи жизни. Модель обучалась, играя сама против себя сотни миллионов раздач. Таким образом она постепенно определяла, какие действия дают максимальное EV.

По заявлению разработчиков, благодаря методу глубокого обучения с подкреплением модель анализирует каждую конкретную ситуацию прямо во время игры и находит оптимальное решение за считаные секунды.

Этот подход подтвердил свою эффективность в матче против Slumbot на дистанции 150,000 раздач: GTO Wizard AI показала винрейт 19.4 ББ/100. Для сравнения: топовые профессионалы обычно ориентируются на ~5 ББ/100. Если перевести это в деньги при лимитах $50/$100 и темпе 200 раздач в час, это примерно $3,880 в час.

Новый покерный AI-бенчмарк

Slumbot — не единственный «соперник», с которым сразилась GTO Wizard AI. Новый бенчмарк впервые сравнил выдающиеся LLM-модели с узкоспециализированным покерным агентом. Результаты показали, что, несмотря на прогресс в логике и рассуждениях, универсальные модели все еще сильно уступают в стратегической глубине.

Место	Модель	Компания	Винрейт (ББ/100)	Раздачи
1	GPT-5.3 (XHigh Reasoning)	OpenAI	–16	5,000
2	Marvel	MIT	–14	5,090
3	GPT-5.4 (XHigh Reasoning)	OpenAI	–17.8	5,000
4	GPT-5.3 (High Reasoning)	OpenAI	–18.2
5	Claude Opus 4.6	Anthropic	–20.4

Даже лучшие ИИ уходят в минус против специализированного агента. OpenAI: GPT-5.3 остается лидером среди универсальных моделей, но все равно уступает GTO Wizard AI с результатом –16.0 ББ/100. Claude Opus 4.6 (–20.4 ББ/100) и Gemini 3.1 Pro (–30.8 ББ/100) показывают, что даже продвинутые ИИ с развитым логическим мышлением испытывают серьезные трудности с безлимитным Холдемом.

Grok 4 от xAI Илона Маска находится значительно ниже и даже не попал в лидерборд с винрейтом примерно –60 ББ/100 с поправкой на удачу. Вывод очевиден: универсальный ИИ пока не способен конкурировать с покерными решениями.

Как учитывался фактор удачи?

Покер — игра с высокой дисперсией, и для достоверных выводов обычно требуется огромная дистанция. В проведенном тесте использовалась технология AIVAT, которая снижает влияние удачи примерно в 10 раз. Это позволило получить статистически значимые результаты при гораздо меньшем количестве раздач.

Брось вызов GTO Wizard: доступ к API открыт

Создатели GTO Wizard открыли API для разработчиков и исследователей, позволив им отправлять собственные модели на тестирование. Этот шаг направлен на развитие более прозрачной конкуренции в области ИИ.

API позволяет разработчикам проводить тестовые раздачи с участием их собственных агентов и получать точные результаты. При этом внутренние механизмы солвера GTO Wizard остаются им недоступны. Условия испытаний:

Минимум 2,500 раздач HU NLHE.
Стеки 200 ББ (сброс после каждой руки).
Лимит — 100,000 раздач в месяц.

Следующий шаг — переход к бенчмаркам в хедз-апе PLO. Но главный вывод уже очевиден: в эпоху развитого ИИ недостаточно просто заявлять о том, что та или иная модель может обыграть человека, — необходимо доказывать это фактами и цифрами в лидербордах.

15 апреля 2026

Материал подготовлен

Аналитик с глубоким пониманием турнирного покера. В своих статьях последовательно разбирает ключевые решения, типичные ошибки и логику розыгрышей на разных этапах МТТ. Делает акцент на системное мышление и умение принимать взвешенные решения.

Покерный обозреватель, специализирующийся на обучении начинающих и игроков среднего уровня. Объясняет сложные раздачи простым языком, уделяя внимание психологии, типовым ловушкам и качеству принимаемых решений за столом.