
«Искусственный интеллект скоро захватит мир» — с таким заголовком каждый день выходят десятки, а может, и сотни публикаций и постов в Сети. Действительно, большие языковые модели (LLM) развиваются с невероятной скоростью, а общение с чат-ботами, такими как Grok, ChatGPT, Gemini, уже стало частью повседневной жизни. От соискателей до работодателей, от студентов до преподавателей — каждый рад переложить свои задачи на плечи искусственного интеллекта.
Логично предположить, что все эти помощники чем-то отличаются друг от друга, иначе не было бы нужды создавать множество LLM-нейросетей. Они по-разному справляются с написанием текстов, решением логических задач, созданием кода.
Макс Павлов, IT-продакт-менеджер из России, задался вопросом: какой чат-бот лучше остальных играет в покер? Чтобы проверить это, Макс решил провести уникальный эксперимент. В нем крупнейшие LLM-боты сразятся между собой, чтобы определить, кто из них — настоящая ИИ-акула, а кто простой нейрофиш.

27 октября — день X
«Я изучаю покер и думаю над тем, как сделать свое обучение эффективнее, — рассказал Павлов в свежем интервью. — Мне интересны солверы, но они слишком сложны, поэтому я пытаюсь найти для себя более простые инструменты. На моем уровне солверы — это, пожалуй, перебор.
Я размышлял, может ли LLM помочь в этом процессе, но, по мнению многих, использовать ИИ нужно осторожно: можно нахвататься неверных привычек, а анализ у таких моделей не всегда стабилен. Я не нашел исследований о том, какая модель лучше всего подходит для подобных задач. Поэтому я решил устроить между ними турнир, чтобы выяснить это самостоятельно».

Эксперимент пройдет онлайн с 27 октября по 3 ноября на платформе PokerBattle AI. Зрители смогут наблюдать за каждой раздачей, результатами и рассуждениями «игроков».
Как в лучших телешоу, окончательный список участников объявят ближе к старту, но ожидается участие крупнейших моделей: Gemini, Claude, OpenAI, DeepSeek и Grok — все они займут свои виртуальные места за столом. Нейросети будут играть «как есть», без особой стратегии, и получат одинаковые вводные данные (промпты). Предварительные условия следующие:
- Стартовые стеки по $2,000.
- Блайнды — $10/$20.
- Общий банкролл — $100,000 фишек у каждой модели.
- Дисциплина — Безлимитный Холдем.
- Победителем станет ИИ, у которого окажется наибольший стек к концу эксперимента (3 ноября).
«Игроки» будут автоматически пополнять стек при падении ниже 50 блайндов и докупаться при вылете, пока не исчерпают банкролл. Блайнды расти не будут.

Зрителям будут доступны показатели по каждому ИИ: VPIP, рейзы, 3-беты, контбеты и другая статистика. «Мы же играем онлайн, почему бы не поделиться всей аналитикой?» — решил Павлов.
«Они точно будут ошибаться»
Павлов признается, что он скорее любитель, чем профессионал, хотя совсем недавно Макс впервые попал в призы на WSOP Europe в Розвадове. Его новый проект родился из интереса и любви к игре, а не ради науки.
«Я бы не назвал этот эксперимент полноценным сравнением LLM-моделей, — объясняет Павлов. — Планирую посмотреть 10-15 тысяч рук. Этого недостаточно для стопроцентных выводов, но вполне хватит, чтобы увидеть сильные и слабые стороны разных моделей».
Для генерации карт, логики и интерфейса Макс использует открытый код, созданный канадскими исследователями теории игр. Но визуальная оболочка и система анализа — его собственная разработка.
Одна из самых любопытных функций — возможность видеть рассуждения каждой модели перед действиями. Это позволит буквально заглянуть в процесс принятия решений. Такой подход отличает проект Павлова от профессиональных покерных ИИ вроде Pluribus и Libratus, которые создавались специально для игры с людьми.
«Libratus — это специализированный бот, оптимизированный под теорию игр, — объясняет Павлов. — Он работает как “черный ящик”: на входе подаются данные о раздаче, на выходе — решение.
LLM устроены иначе: они не выбирают оптимальное действие. Их обучали на колоссальных массивах данных, где есть и теория игр, и форумы, и блоги, и покерная литература. Но ошибок они будут допускать много. Мне интересно, смогут ли они выработать простые, понятные стратегии».
Может ли робот обучаться в процессе игры?
Языковые модели далеки от GTO-покера. Но смогут ли они играть эксплуативно, подстраиваясь под соперников?
«Важно, чтобы модель умела связывать прошлые раздачи с текущей ситуацией. Я могу добавить в контекст до сотни последних рук и посмотреть, как ИИ воспользуется этой информацией. Механика нотсов уже реализована — почему бы не попробовать? Возможно, данных окажется слишком много, но, может быть, именно это придаст игре новое измерение».
Проект уникален тем, что в нем используются только инструменты, которые находятся в открытом доступе, и никаких «секретных» разработок. В рамках эксперимента Павлов написал весь проект самостоятельно, почти без сторонней помощи. «В каком-то смысле это доказательство того, что можно создавать сложные вещи, даже если ты не программист, — делится он. — Я сделал все это с помощью искусственного интеллекта».

Хотите поделиться своим мнением или оставить комментарий?
Написать