Два года назад покерный бот Libratus без проблем одолел в хедз-апе четырех профессионалов, входящих в топ-100 игроков по безлимитному холдему. На это ему потребовалось всего 20 дней. Теперь же разработкой заинтересовались американские военные. Согласно данным Wired (американский ежемесячный журнал), та же технология, которая использовалась для создания Libratus, в настоящее время находится на службе армии США в поддержке оборонного подразделения Пентагона.
Libratus Creator и военный контракт
Вряд ли американские военные имеют план победить другие страны в безлимитный холдем. Но к данному ИИ может быть подключено множество приложений, которые помогут командованию принимать лучшие решения при военных действиях.
Libratus был создан группой ученых университета Карнеги-Меллон во главе с Туомасом Сандхольмом и Ноамом Брауном. А в 2017 году Сандхольм создал стартап-компанию Strategy Robot, которая адаптировала Libratus под военные цели. Одной из таких была симуляция в военных играх.
Видимо, Пентагон проявил интерес к разработке, так как Wired обнаружил публичное подтверждение, что Strategy Robot заключил двухлетний контракт на сумму $10 млн с армией США. Пока ни армейское, ни оборонное министерство никак не прокомментировали публикацию издания. Однако в своем интервью журналу Сандхольм заявил, что стандарт Libratus может тестировать ограниченное количество стратегий для обеих сторон, что может помочь военным в учениях:
«Это открывает для нас массу возможностей для эксплуатации, потому что настоящий противник может не играть в соответствии с вашими предположениями».
Сокрушительная победа Libratus
В Libratus были загружены только основные правила техасского холдема – комбинации и последовательность хода игроков. Потом запустился процесс самообучения, программа играла сама с собой и училась на собственных ошибках. Проведя несколько триллионов раздач, ИИ стал понимать, как необходимо поступать, чтобы выиграть раздачу. По утверждению разработчиков, в Libratus никогда не загружалась история раздач живых игроков – программа анализировала только свою игру.
После того, как ученые заявили, что создали практически идеального бота для покера, четыре профессиональных игрока решили проверить этот факт на деле. Ими были Джейсон Лес, Джимми Чу, Даниэль Маколи и Донг Ким. Тестирование проходило в течение 20 дней, на протяжении которых игроки проводили за виртуальными столами по 12 часов. Сперва Libratus показал преимущество, но на шестой день человеческий фактор стал доминировать, как оказалось, ненадолго. Машина быстро научилась не только распознавать блеф, но и сама активно им пользоваться. Как утверждали игроки, было такое ощущение, что Libratus получил навыки профессионального покериста.
За 120,000 рук Libratus выиграл практически $2 млн (игра велась на фишки, несмотря на то, что тест проводили в казино), и ни одна из применяемых стратегий, включая поднятие ставки в 80% раздач, не увенчалась успехом. Разгромленные профи получили по $50,000 от спонсоров.
Хотите поделиться своим мнением или оставить комментарий?
Написать