Очередная победа ИИ над человеком — на этот раз в покере

Несколько часов назад завершился 20-дневный турнир, в котором система искусственного интеллекта, программа под названием Libratus, противостояла четырем сильнейшим игрокам в покер. Конкретно речь идет о версии Heads-Up No-Limit, в которой игра идет один на один, а число игровых состояний превышает 10160. Было разыграно в общей сложности 120 тысяч раздач, по результатам которых Libratus обошла всех своих соперников, заработав фишек на $1.7 млн.

Событие это знаменательно тем, что покер, в отличие от шахмат или го, является игрой с неполной информацией — вы не видите карт своих соперников, а кроме того результат во много зависит от везения, умения блефовать и т.д. «Мы [люди] так хороши в покере, что даже суперкомпьютер не может нас обыграть. Если мы проиграем, то лишимся престижа«, заявил один из игроков накануне турнира. В предыдущем состязании Libratus с профессиональными игроками (в 2015 году) вверх над ИИ взял человек, и накануне нынешнего шансы на победу живого интеллекта оценивались 4:1 и 5:1.

Libratus была разработана в Университете Карнеги-Меллон профессором Туомасом Сендхолмом (Tuomas Sandholm) и аспирантом Ноамом Брауном (Noam Brown). Программа состоит из трех блоков. Первый не претерпел с 2015 года никаких изменений и занимается тем, что заранее просчитывает и составляет огромный список возможных стратегий игры. На это ушло время, эквивалентное 15 млн. часов игры в покер. Второй блок Libratus был полностью переработан и предназначен для улучшения стратегии с каждой новой раздачей в процессе самой игры, на основе допущенных оппонентом промахов — т.н. эксплуатация, нащупывающая его слабые стороны. Насколько эффективным этот блок был в прежней версии программы разработчики сказать затрудняются, но о нынешнем они однозначно отзываются весьма лестно. Наконец третий блок обнаруживает слабости собственных стратегий Libratus (выявляя эксплуатационную игру противника) и корректирует их к предстоящим раздачам.

Несмотря по победу искусственного интеллекта, в соответствии с условиями турнира призовой фонд ($200,000) был поделен между проигравшими игроками. Впрочем создателей Libratus это вряд ли расстроило — по словам профессора Эссекского университета (Англия), «это большое событие и впечатляющий шаг вперед«.

New Scientist