Почти половина звонков Google Duplex выполняется человеком
Одним из самых эффектных достижений искусственного интеллекта стала анонсированная год назад программа Google Duplex, которая способна вместо человека заказать, например, на его имя столик в ресторане. В продемонстрированных на Google I/O 2018 примерах она разговаривала как человек — с абсолютно естественной интонацией, вставкой междометий (вроде традиционного «м-м-м», предшествующего ответу на вопрос) и главное релевантными ответами на уточняющие вопросы сотрудника ресторана. Авторы сегодняшней статьи в газете The New York Times убедились в этом лично, однако обнаружили, что часть таких звонков выполнялась человеком, очевидно сотрудником колл-центра Google. На протяжении нескольких дней они посредством Google Duplex обзвонили больше дюжины ресторанов и сделали четыре успешных резервирования — три из которых были выполнены не ботом, а человеком.
В Google подтвердили, что часть звонков выполняется с участием человека: в 25% он начинает разговор, в 15% — подключается к разговору, начатому ботом. Таким образом, 40% звонков фактически выполняется человеком (хотя небольшая выборка журналистов показывает участие человека в 75% случаев). В Google объясняют вовлечение людей консервативным подходом, обусловленным уважением к компаниям, которым звонит Google Duplex. Сотрудники колл-центра привлекаются, например, когда пользователь сервиса подозревается в спаме. Или когда нет уверенности в том, что компания (например, ресторан) принимает заказы по телефону. В частности такое предположение менеджер по продуктам, курирующий Google Duplex, высказал в отношении выполненного человеком звонка в ресторан тибетской кухни. Однако авторы статьи убедились, что повторный звонок в ресторан на следующий день также был выполнен человеком. А лично мне непонятно что мешает Google Duplex задать соответствующий вопрос в самом начале разговора и повесить трубку, если заказы по телефону не принимаются.
Также интересна цель, которую преследует Google, добровольно беря на себя функции бесплатного секретаря миллионов людей. Авторы публикации предполагают, что Google использует «живые» звонки для получения обучающих данных. Но на мой взгляд значительно дешевле приобрести эти данные у многочисленных кафе и ресторанов, которые скорее всего записывают все подобные переговоры (конечно, при условии соблюдения конфиденциальности этих данных).
Как бы то ни было, новая технология Google далека от совершенства даже в отношении таких узких задач как бронирование столика в ресторане. И как уже отмечалось в нашей первой публикации про Google Duplex, нечего и говорить о поддержании беседы на какие-то отвлеченные темы. Тем не менее, со времени презентации данной технологии прошел только год — возможно еще через несколько лет она станет куда более совершенной.
Вопреки часто встречаемой в тематических публикациях точке зрения, крупный бизнес вовсе не игнорирует задачу создания т.н. сильного искусственного интеллекта (ключевым проявлением которого как раз является понимание смысла). Думать так весьма наивно — появление такой технологии не только переведет интерфейс человек-машина на естественно-языковой, но и откроет для самообучения искусственного интеллекта безграничные возможности. Соответственно искусственный интеллект сможет заменить человека во множестве (если не во всех) интеллектуальных сферах деятельности — за что большие деньги будут выкладывать и бизнес, и государство, и частные потребители.