Cortana научилась различать породы собак (видео)

На стартовавшей вчера двухдневной конференции Microsoft Research Faculty Summit компания продемонстрировала новые возможности своего встроенного в мобильные устройства виртуального помощника Cortana (аналога Siri в iPhone). В присутствии публики система два раза правильно определила породу показанных ей собак — далматина и родезийского риджбека. В третьем случае собаку, которая присутствовавшая публика сочла лабрадудлем, Cortana идентифицировала в качестве терьера. Как оказалось, речь шла о коббердоге или австралийском лабрадудле, в котором скрещены в том числе эти две породы.

Фактически Cortana продемонстрировала возможности искусственного интеллекта, одной из главных возможностей которого является распознавание образов. Это стало возможным благодаря реализации проекта Adam, в рамках которого было обработано 14 млн. изображений из Интернета и из них отобрано 22 тыс. категорий. В основе системы искусственного интеллекта лежит усовершенствованная Microsoft технология HOGWILD!, разработанная в Висконсинском университете в Мадисоне и работающая на базе облачного сервиса Microsoft Azure. Это система т.н. «глубокой нейронной сети» или «нейронной сети глубого обучения» — своего рода компьютерной модели нейронной сети мозга. С той разницей, что в отличие от нейронов нервной системы, компьютеры сети обладают большей степенью автономности (принцип т.н. «асинхронности»). Согласно Microsoft, по сравнению с нейронной сетью Google Brain, состоящей из 16 тыс. компьютеров, ее собственная система в 30 раз эффективнее (требует меньше компьютеров), в 50 раз быстрее, в 2 раза точнее, и к тому же масштабируется. Округление этих впечатляющих цифр внушает некоторое подозрение в их отчасти рекламном происхождении, но тем не менее результат, как говорится, налицо.

Значимость и востребованность технологий визуального распознавания трудно переоценить. Представьте себе знакомую по Fire Phone функцию Firefly применительно не только к медиа-продукции или книгам на прилавках магазинов, но и вообще любому предмету, будь то сдобная булка, калорийность которой вас интересует, подозрительное пятно на коже или ягода в лесу. Не исключено, что в среднесрочной перспективе подобной технологией будут оснащены, например, умные очки, когда при виде встречного прохожего на вашем виртуальном экране выводится относящаяся к нему информация из социальных сетей, сайтов знакомств и других аналогичных ресурсов. Как это отразится на их дальнейшей популярности среди любителей выкладывать в Интернете свои личные фото — вопрос отдельный.

Next at MicrosoftMicrosoft ResearchWIRED