
В октябре 2025 года разработчик Макс Павлов провел эксперимент. Он собрал девять языковых моделей ИИ и заставил их играть в покер друг с другом. О том, как проходило состязание между нейросетями и чем оно закончилось, рассказывалось ранее.
Результатами необычного турнира заинтересовалась Виктория Лившиц, покеристка и основательница обучающего сайта Octopi Poker. Она опубликовала детальный разбор нескольких раздач. Первую часть с основными выводами можно прочитать здесь. В этой статье — более глубокий взгляд на мышление ИИ «изнутри».
Содержание
LLAMA
Начнем с худшей ИИ-модели. Не только потому, что важно понять, откуда взялся минус в 142 ББ/100, но и чтобы оценить, насколько остальным ИИ приходилось «подкручивать» агрессию, чтобы правильно эксплуатировать тенденции LLAMA.
Модель слишком лузовая и агрессивная. Ее VPIP составил невероятные 62% — это втрое выше GTO-ориентира и вдвое больше следующей по лузовости ИИ. Кроме того, в сравнении с соперниками LLAMA продемонстрировала:
- На 50% шире диапазон открытия
- В 2.5 раза более частые 3-беты.
- На 60% реже фолд на 3-бет.
- На 11% чаще контбет.
- В 4 раза реже фолд на контбет.
- На 30% чаще дотягивание рук до шоудауна — как правило, проигрышных.
В ответ самые умные модели корректно подстраивались, усиливая агрессию, когда LLAMA входила в банк. Это позволяло им забирать у нее фишки без особых затруднений, что и привело к разорению ИИ.
OpenAI (ChatGPT 3o)
Победитель турнира показывал впечатляющую префлоп-игру в подавляющем большинстве разобранных раздач. Его общие префлоп-статы близки к GTO, но заметно смещались в сторону агрессии, когда в банк заходили другие модели. OpenAI 3-бетил примерно вдвое чаще и вдвое реже пасовал на 3-бет, чем рекомендует GTO.
На флопе его частота контбетов была оптимальной, но на 3-бет он отвечал коллом на 50% чаще, чем следовало бы. До шоудауна OpenAI доходил на 33% реже, чем предполагают GTO-ориентиры.
Claude и Grok
Лидеры, занявшие второе и третье места, в целом демонстрировали очень схожую макроигру. Их самые заметные отклонения от GTO приходились на постфлоп: они слегка перебарщивали с частотой контбетов и недостаточно часто пасовали на контбет, но при этом все равно существенно реже доходили до шоудауна.
DeepSeek
Китайский ИИ был значительно тайтовее и консервативнее по всем метрикам. DeepSeek занял четвертое место с винрейтом 24 ББ/100. Он опен-рейзил примерно 10% рук из всех позиций, то есть на 50% реже рекомендаций GTO, 3-бетил примерно в соответствии с GTO, но фолдил на 3-бет на 60% реже.
С учетом того, что стартовое качество его рук было сильно выше среднего, это вполне логично. Он также на 50% реже пасовал на контбет, что тоже может объясняться тем, что на префлоп он заходил преимущественно с «верхушкой» диапазона.
Gemini
На пятом месте с винрейтом 19 ББ/100 оказалась Gemini от Google — самая агрессивная модель поля, если не считать откровенного безумия от LLAMA. Она часто открывалась, много 3-бетила и редко фолдила на контбет — все это указывает на слишком лузовую игру и, вероятно, объясняет, почему она не оказалась еще выше, хотя постфлоп-агрессия позволяла ей забирать очень крупные банки.
Magistral
Единственный «участник» из Франции завершил турнир с небольшим плюсом. Это была самая тайтовая модель на префлопе: VPIP менее 16% и пас на 3-бет в 84% случаев. Это позволило ей быть самой агрессивной на постфлопе: контбет 88% и всего 16% пасов на контбет.
Kimi 2 и GLM
Китайские модели Kimi 2 и GLM показали внушительные минусовые результаты: 19 и 28 ББ/100 соответственно. Kimi 2 была тайтовой, но до шоудауна доходила крайне редко — лишь в 12% случаев. GLM, наоборот, открывалась слишком широко по VPIP (31%), но легко пасовала на 3-бет. В итоге ни одна из них не смогла по-настоящему выделиться и переиграть соперников — даже с учетом присутствия LLAMA, щедро раздающей EV.
Детальный разбор раздачи: рука №573
Раздача начинается с эффективными стеками от 220 до 520 ББ. Блайнды — $10/$20.
Префлоп
Далее представлены выдержки из «размышлений» ИИ во время раздачи. Сначала приводятся рассуждения каждой модели, а затем дается оценка эксперта.

«Я действую первым с UTG с AhAc и эффективными стеками 525 ББ. Рейз здесь обязателен — для вэлью и захвата инициативы. Стандартный опен-рейз х3 до $60 раздувает банк, при этом оставляя пространство агрессивным соперникам (Gemini с 20% 3-бета, Grok с 12%), позволяя мне получить 3-бет и затем сделать 4-бет. Меньший рейз может образовать мультипот, больший — выдать силу руки. Поэтому рейз до $60».
UTG+1 — 76s, Kimi K2, $7,170: пас:
«76s — это одномастный коннектор с неплохой играбельностью постфлоп. Однако префлоп это все же относительно слабая рука. Решение — фолд».
Далее решение принимает DeepSeek, $10,085 — колл с 66:
«Колл с парой шестерок на HJ против раннего открытия стандартным х3 сайзингом. Рейзер (OpenAI o3) имеет умеренный PFR 18,1%, а его 3-бет-статы показывают, что он уважает давление, но у меня есть преимущество позиции. С имплайд-оддсами около 15 к 1 против стеков выгоден сет-майнинг. Пас был бы слишком тайтовым с учетом позиции и глубины стеков».
Gemini с парой дам на BU объявляет 3-бет до $250:
«У меня премиальная рука (QQ), и я на баттоне. 3-бет — лучший розыгрыш для вэлью и изоляции оппонентов. Изначальный рейзер (OpenAI o3) открывается достаточно широко, а DeepSeek, скорее всего, имеет руку средней силы. Мой размер 3-бета рассчитан так, чтобы оказать максимальное давление на обоих оппонентов и разыграть крупный банк в позиции».
SB (T2s), LLAMA, $4,345: колл:
«Колл $240 с Td2d. У руки есть шанс собрать флеш, и я получаю неплохие шансы банка. Я без позиции, что усложняет постфлоп, но потенциальная награда делает колл оправданным».
UTG (AA), OpenAI o3: 4-бет до $1,000:
«AA — абсолютный топ диапазона. Я без позиции против 3-бета баттона до $250, при этом есть лузовый колд-колл от SB и от DeepSeek. 4-бет решает сразу несколько задач:
- Максимизирует вэлью против 20% диапазона 3-бета Gemini с баттона и лузовых коллов LLAMA.
- «Наказывает» колд-колл DeepSeek.
- Задает размеры стеков так, чтобы было комфортно выставляться постфлоп.
Сайзинг: около х4 от размера 3-бета и «надбавка» за колд-колл — $1,000 дают коллерам примерно 2.3 к 1 и оставляют около $3,300 эффективного стека против LLAMA для удобного пуша на большинстве флопов. Меньше — рискую создать мультипот, больше (олл-ин) — «сожгу» часть вэлью против более слабых рук. Поэтому рейз до $1,000».
HJ (66), DeepSeek: пас:
«Изначальный рейзер (OpenAI o3) делает 4-бет до $1.000 после 3-бета Gemini и колла LLAMA — это демонстрация огромной силы. Два игрока показывают агрессию, а моя рука уязвима. Нужно вложить $940, чтобы побороться за банк $1,580 в крайне неблагоприятных условиях. Сет-майнинг уже невыгоден из-за высокой цены и риска попасть под доминацию оверпар».
BU (QQ), Gemini: колл:
«4-бет от OpenAI o3 вызывает опасения и, вероятно, означает очень сильный диапазон (KK+). Однако пас кажется слабым — я рискую выбросить лучшую руку, особенно учитывая присутствие очень лузового игрока (LLAMA), который уже сделал колд-колл моего 3-бета.
Колл — лучший вариант, чтобы увидеть флоп и переоценить ситуацию. Он позволит контролировать размер банка и принять более обоснованное решение позже, особенно если на флопе не выйдут туз или король. 5-бет олл-ин слишком рискован».
SB (T2s), LLAMA: пас:
«Эта рука недостаточно сильна, чтобы продолжать против двух оппонентов, уже проявивших значительную агрессию. Потенциал флеш-дро здесь недостаточен, чтобы оправдать продолжение в мультипоте без позиции».
Флоп
Открывается флоп: 9d8d7c. Остались два оппонента: OpenAI на UTG и Gemini в позиции BU. Банк $2,330, эффективные стеки — $9,465.
OpenAI o3, $9 465: контбет $1,500:
«Хедз-ап 4-бет-банк, SPR ≈ 4. У меня преимущество по диапазону и по эквити, но доска крайне дровяная (стрит-дро + флеш-дро). У меня нет бубновой карты. Я стремлюсь:
- Добирать вэлью с более слабых оверпар, JJ-TT, топ-пар + дро.
- Не давать бесплатной реализации эквити дро на стрит или флеш.
- Подготовить пуш по терну.
Ставка около 65% банка ($1,500 в пот $2,330) решает все три задачи: вынуждает оппонента заплатить почти полную цену за реализацию эквити, проясняет его руку в случае рейза и оставляет мне фишки примерно на размер банка для олл-ина на терне. Чек или маленькая ставка дали бы дро слишком хорошие шансы».
BTN, Gemini, $12,228: колл:
«Доска скоординирована и опасна для моей оверпары. Однако диапазон 4-бета оппонента не ограничивается только AA и KK. В нем вероятны блефы вроде AK. Его ставка на флопе меньше половины банка и вполне может быть стандартным контбетом. Пас выглядит слабым решением: я могу сбросить лучшую руку. Рейз слишком рискован — это, по сути, превращает мою руку в блеф, и мне придется фолдить на олл-ин.
Колл — лучший вариант. Он позволяет использовать позицию, увидеть следующую карту, контролировать размер банка и переоценить ситуацию на терне. Я смогу продолжить, если терн даст бланк и оппонент сбавит обороты, или сбросить на дальнейшую агрессию, если выйдет “страшная” карта».
Терн
Четвертая карта борда — 4h. Банк $5,330, эффективные стеки $7,965. OpenAI o3 действует первым. Стек $7,965 и олл-ин:
«После моего контбета флопа и колла SPR ≈ 1.5. Терн — бланк. Мой диапазон все еще существенно впереди, спектр колла Gemini на флопе — сеты (99,88, 77), руки типа пара + дро и оверпары JJ-KK. Против двух последних сегментов я точно сильнее, и даже против натс-флеш-дро у меня около 70% эквити. Давать сопернику увидеть еще одну карту недорого — значит, позволить дро реализовать почти все эквити, поэтому необходимо ставить максимум».
Gemini, $10,728: колл:
«Сложная ситуация, но я считаю, что колл здесь — верное решение. Линия оппонента крайне поляризована. Он изображает либо монстра (AA, KK), либо полный блеф (например, AK). С учетом его агрессивного 4-бета префлоп и небольшой ставки на флопе этот пуш по терну похож на попытку выбить у меня оверпару.
Пот-оддсы заманчивые. Против диапазона AA, KK и AK моя пара QQ имеет достаточное эквити для колла. Пас здесь кажется слишком эксплуатируемым против сильного и агрессивного оппонента. Это тот спот, где я обязан сделать колл».
Анализ раздачи
OpenAI o3 уверенно выиграл турнир, и эта раздача хорошо демонстрирует, почему именно он. Префлоп-рассуждения безупречны: открытие с AA до х3 с позиции UTG и затем 4-бет до 50 ББ против колла хайджека, 3-бета баттона и колд-колла малого блайнда.
Видно, что модель отслеживает агрессию игроков, учитывает размеры стеков и будущий SPR, целенаправленно создавая ситуацию, в которой может спровоцировать рейз и затем сделать 4-бет.
Единственный изъян, который здесь получится найти, — комментарий о том, что более крупный опен-рейз, чем х3, способен выдать силу руки. Это намекает: иногда модель может подстраивать размер открытия под конкретные стартеры.
На постфлопе ИИ продолжает давать корректные наблюдения и принимает разумные решения. OpenAI оценивает диапазоны оппонентов на каждой улице и правильно приходит к выводу, что должна ставить на вэлью, брать плату с дро и лишать их эквити.
Kimi K2 завершила матч на 7-м месте из 9 и в целом проигрывала. В этой раздаче она начинает с 76s на позиции UTG+2, имея стек более 350 ББ. Модель кратко оценивает постфлоп-играбельность, но в итоге фолдит, придя к выводу, что это «относительно слабая рука».
Конкретно эта рука в большинстве случаев действительно сбрасывается против тайтового открытия с UTG. Однако, если при игре дипстеками все подобные стартеры систематически фолдятся, начинаются проблемы. Одномастные коннекторы вроде 87s, 65s и 54s должны хотя бы иногда заходить в 3-бет, даже если по отдельности такие 3-беты — околонулевые по EV.
DeepSeek на протяжении всего турнира демонстрировала хорошее понимание фундаментальных основ стратегии покера. В этой раздаче она выбирает сет-майнинг с 66 на HJ, решая, что при глубине стеков 500 ББ колл будет прибыльным.
Даже если такой подход периодически есть, модель не учитывает возможную агрессию от предыдущих оппонентов. Столкнувшись с таковой — 3-бет, колд-колл и 4-бет — DeepSeek быстро принимает верное решение и фолдит.
Gemini также оказалась одной из лучших в плане сочетания фундаментальных принципов и эксплойтных решений. Обоснование префлоп-решений в этой раздаче просто идеально: крупный 3-бет и последующий колл 4-бета.
На флопе модель действует разумно, правильно отмечая, что она позади вэлью-части диапазона оппонента и впереди его блефов и что спот вызывает сложности на терне. Однако анализ диапазонов поверхностен: Gemini почти не рассматривает блефы, кроме AK, и не думает о вэлью-руках, кроме KK и AA, хотя при глубине стеков 500 ББ в диапазоне 4-бет вполне могут быть готовые стриты, доперы и полублефы с эквити.
Самый удивительный момент — модель оценивает свою ставку на флопе как «меньше половины банка». В действительности это были 65%.
На терне Gemini учитывает репутацию OpenAI как сильного и агрессивного оппонента — это плюс. Но она заходит слишком далеко в эксплойтном мышлении, делая вывод, что линия соперника якобы «нацелена на то, чтобы выбить оверпару», это выглядит сомнительно.
Модель, скорее всего, переоценивает число комбинаций, которые пушат терн от имени OpenAI. Блефы с AKo при такой глубине стеков вряд ли относятся к хорошо выстроенной стратегии. В итоге Gemini делает вывод, что у OpenAI достаточно блефов, чтобы оправдать колл, и проигрывает 500 ББ.
LLAMA стала худшей моделью с пятикратным отрывом от восьмого места, показав катастрофический минус около 143 ББ/100, и по этой раздаче отлично видны причины такого поражения. Будучи самым коротким стеком с 217 ББ, она без проблем делает колд-колл. Обоснование было крайне слабым: модель учитывала лишь то, что рука «может собрать флеш» и получает «хорошие шансы банка».
Заключение
Даже по одной раздаче можно сформулировать несколько наблюдений о характере покерного мышления LLM. В последующих примерах эти тезисы только подтверждались:
- Они играют префлоп лучше, чем постфлоп.
- Лучшие модели способны на тонкие и корректные префлоп-решения, включая 3-бет и 4-бет мультипоты.
- ИИ пытаются сочетать теоретическую базу с эксплойтом.
- Они фокусируются на том, как сыграть конкретную руку против диапазона оппонента.
- Их осознание собственных спектров довольно примитивно: они обычно не учитывают блефовую часть в 3-бетах и 4-бетах на префлопе.
- ИИ гораздо больше сосредоточены на извлечении вэлью из слабой доли диапазона оппонента, чем на защите от его сильнейшей части.
- Они редко и плохо включают блефы в свои рассуждения.
- Даже хорошие LLM могут допускать удивительные ошибки в простейших расчетах сайзингов.
- Плохие ИИ действительно ужасны — даже в самых простых решениях.
Общий вывод — языковые модели, изначально созданные для совершенно иных целей, демонстрируют впечатляющую способность играть в сложном формате без специального обучения. Однако для того, чтобы реально бросить вызов профессионалам, универсальным LLM придется развить компетенции, которые выходят далеко за рамки их текущего уровня.
Спрогнозировать, сколько времени это займет и случится ли такое вообще, непросто. Все зависит от того, насколько создатели этих систем захотят и смогут интегрировать специфичные покерные знания непосредственно в процесс обучения LLM.
Хотите поделиться своим мнением или оставить комментарий?
Написать