IBM Project Debater: искусственный интеллект, который умеет спорить
Компания IBM знаменита по меньшей мере двумя крупными проектами в области искусственного интеллекта: Deep Blue, который в 1997 нанес поражение тогдашнему чемпиону мира по шахматам, Гарри Каспарову, и Watson, в 2011 обыгравшим двух чемпионов Jeopardy! (российский аналог — Своя игра). Примерно тогда же, в 2012, IBM приступила к третьему проекту такого уровня, Project Debater. Его целью является создание программы, которая умеет вести полемику с человеком на заданную тему. И вот вчера, спустя шесть лет разработок, в Сан-Франциско в присутствии нескольких десятков журналистов состоялась первая публичная презентация нового детища IBM.
Состязание включало две дискуссии: одна на тему государственного субсидирования космических исследований, другая — расширения применения телемедицины. В одном обсуждении оппонентом компьютера выступал президент Международного дискуссионного общества в Израиле, а в другом — чемпионка Израиля по искусству ведения дискуссии за 2016 год. Разумеется, ни один из участников (включая компьютер IBM) не знал заранее тему обсуждения и поэтому не имел возможности подготовиться к ней. Выступление каждого из участников, включая компьютер IBM, состояло из трех частей: 4-минутной вступительной части, 4-минутного возражения по существу сказанного оппонентом, и 2-минутного заключения.
Для подготовки ответа на 4-минутное выступление оппонента в распоряжении компьютера IBM имелась пара минут, в течение которых он извлекал требуемую информацию из 300 млн заранее проиндексированных текстов (новостей, научных публикаций и т.д.) на сотню разных тем.
К сожалению, полная запись дискуссии пока не обнародована, но из нескольких публикаций очевидцев можно заключить следующее: Project Debater превосходит своих оппонентов с точки зрения владения материалом, но уступает им в качестве его подачи. Последнее проявляется, например, в том, что разработке IBM не хватает «лингвистической точности» и ясности аргументов, она несколько раз повторяет одно и то же (пусть и разными словами), некоторые предложения получаются не вполне связными, а вставленные шутки не всегда уместны. Но самое главное и вполне очевидное — разработка IBM не понимает смысла ни в тексте используемой ею информации, ни в выступлениях своих оппонентов. Это, в частности, следует из весьма спорных заявлений (например, что космические исследования важнее более качественных дорог, образования и здравоохранения), игнорирования аргументов оппонента и совсем уже откровенных ляпов. Например, в своем выступлении компьютер произнес слова «Скот Пелли» и «VoiceOver» — имя теле-корреспондента (очевидно, из использованных в качестве источника информации новостей) и название программы, которая озвучивает текст с экрана.
Поэтому сенсации не случилось — пока принципиально не изменился подход к созданию искусственного интеллекта, все подобные разработки останутся не более, чем имитацией интеллекта, с той или иной степенью достоверности. Не стоит обольщаться ни по поводу мнимого прохождения компьютером теста Тьюринга, ни по поводу мнимого превосходства ИИ над человеком в понимании текста. Но это вовсе не значит, что такие разработки бесполезны — по отзывам самой IBM еще два года назад на одно-два толковых утверждений в её системе приходилось по 5-10 бестолковых. И действительно, если вдуматься, извлечение полезной и релевантной информации из 300 млн текстов — задача весьма нетривиальная.
И вот здесь возникает чрезвычайно важный вопрос: а так ли необходимо понимание смысла искусственному интеллекту? В одной из публикаций на эту тему Gadgets News вспоминал ставшую уже классической книгу Джеффа Хокинса «Об интеллекте». В ней он перечисляет навыки, недоступные искусственному интеллекту того времени (2004 год) по причине, с точки зрения автора, отсутствия у тогдашних нейросетей действительно разумной составляющей. К тем примерам Хокинса можно присовокупить еще один:
Суть состоит в том, чтобы вы могли сказать машине, чего вы от нее хотите, обычным языком, и она бы выполнила ваши команды. Личной цифровой записной книжке вы могли бы сказать: «Перенеси дочкину игру по баскетболу с субботы на сегодня, на десять утра». Подобного рода вещи невозможно было сделать с помощью традиционного искусственного интеллекта. Даже если бы компьютер распознал каждое слово, для выполнения задания ему нужно знать, где находится школа вашей дочери, какую именно субботу вы имели в виду, и, вообще, что такое баскетбольная игра, поскольку у вас может быть занесена информация как «Ментло против Сен-Джо»… Подобные приложения требуют, чтобы машина могла не только слушать, но и слышать разговорную речь, что пока не достижимо.
Как мы знаем, даже интеллектуальные помощники на смартфонах (вроде Google Assistant) с подобными задачами уже справляются. Подозреваю, что если бы Джеффу Хокинсу в 2004 дали послушать, как Google Duplex по телефону заказывает столик в ресторане, он бы решил, что имеет дело с полноценным искусственным разумом. В таком случае почему бы не допустить, что еще через 15-20 лет даже в рамках эволюционного развития нейросети научатся решать задачи, которые мы сегодня считаем прерогативой сильного искусственного интеллекта?