Искусственный интеллект впервые обыграл пятерых чемпионов в покер

В январе 2017 года стало известно, что компьютерная программа Libratus обыграла четырех профессиональных игроков в покер и выиграла два миллиона долларов.
 
Однак ее создатели решили не останавливаться на достигнутом и сейчас представили миру новую версию программы — Pluribus, которая уже обыграла в техасский холдем сразу пятерых чемпионов в этой игре, «сидя» с ними всеми за одним столом, прямо как в традиционных казино. О разработке ученых пишет журнал Science.
 
Как рассказал Ной Браун (Noam Brown) из Университета Карнеги-Меллона в Питтсбурге (США), один из создателей Pluribus, искусственный интеллект, вырабатывая свою стратегию, создал несколько инновационных приемов, которые могут в дальнейшем повлиять на игру профессионалов по покеру.
 
Авторы Pluribus оснастили его «абстрактным действием» и «абстрактной информацией» — так программа смогла отбросить лишние варианты дальнейших ходов и оставить лишь те, которые потребуются для принятия решения. Во время тестов Pluribus, используя метод самообучения и систему «минимизации сожалений» (когда программа максимально сокращает разницу между уже принятым решением и оптимальной стратегией), сражалась в покер с пятью своими копиями, поначалу играя наугад. Впоследствии ИИ научился анализировать ходы и понял, какие действия и с какой вероятностью ведут к победе в игре.
 
Главная часть эксперимента проходила на протяжении 12 дней в два этапа: один игрок против пяти копий Pluribus либо пять профессионалов против ИИ.
 
Ежедневно в игре участвовали пять разных чемпионов по покеру, каждый из которых в прошлом выиграл более миллиона долларов. В итоге с помощью своей уникальной и в чем-то «парадоксальной» стратегии ИИ более чем за десять тысяч раздач обыграл всех лучших игроков и заработал полмиллиона долларов.
 
«Главный плюс Pluribus — способность совмещать разные стратегии. Это то, к чему идут профессиональные игроки в покер. Мало у кого получается менять тактику случайным образом и оставаться в плюсе. Почти все люди не справляются с такой задачей», — рассказал рекордсмен World Poker Tour Даррен Элиас (Darren Elias), который также потерпел поражение в игре с ИИ.
 
А если вы хотите понять, что движет любителями игр и к чему может привести эта страсть, — прочитайте наш большой материал о психологии азарта.
Метка “Новость”: 
Да
Дата трансляции: 
пятница, июля 12, 2019 – 13:38
Лид: 
На это достижение у ученых ушло более двух лет.
Дискрипшен: 
На это достижение у ученых ушло более двух лет.
Рубрика: 
Автор: