Nvidia Drive PX 2: второе поколение автомобильного суперкомпьютера на базе архитектуры Pascal

Drive PX 2

Вслед за своим главным конкурентом, компанией AMD, Nvidia представила первое устройство на базе своей новейшей архитектуры Pascal. И если AMD традиционно нацелена на рынок десктопных видеокарт, то Nvidia, в полном соответствии с нашими ожиданиями, посвятила свою пресс-конференцию системе беспилотного управления автомобилем. Главными элементами представленной сегодня технологии стали второе поколение бортовой автомобильной супер ЭВМ Drive PX 2 и глубокая нейронная сеть DriveNet.

Образно говоря, Drive PX 2 выполняет роль водителя, который с нескольких с установленных на автомобиле камер считывает окружающее пространство, идентифицирует его объекты (дорожные полосы, соседние автомобили, пешеходы, дорожные знаки и т.д.), и строит трехмерное изображение, которое выводит на дисплей в режиме реального времени. На пресс-конференеции была продемонстрирована запись реальной поездки по загородному шоссе с одновременным выводом трехмерной схемы.

На ней, как в простенькой компьютерной игре, вы словно видите сверху свой автомобиль и проносящиеся мимо него кубы — другие транспортные средства. Не нужно смотреть ни в зеркала заднего вида, ни даже в лобовое стекло — общую и очень наглядную картину формирует и выводит на экран сам компьютер. Он же, исходя из дорожной обстановки, показывает все возможные в текущий момент маршруты для маневрирования в потоке машин.

Своего предшественника Drive PX 2 превзошел во всех отношения. Напомним, что анонсированный ровно год назад DRIVE PX был оснащен двумя 20-нанометровыми процессорами Tegra X1 на базе архитектуры Maxwell. Один такой процессор содержит 256-ядерное ГПУ, 8-ядерное ЦПУ (4 x Cortex-A57 + 4 x Cortex-A53) и имеет энергопотребление в 10-15 Вт. С учетом производительности Tegra X1 в 512 Гфлопс (FP32), общая производительность Drive PX составляет 1 Тфлопс.

Drive PX 2

В свою очередь Drive PX 2 получил следующую конфигурацию:

  • 2 процессора Tegra на базе 16нм FinFET архитектуры Pascal (в которых, судя по всему, комбинируются ГПУ и какие-то из приведенных ниже ядер ЦПУ)
  • 2 дискретных ГПУ на базе 16нм FinFET архитектуры Pascal
  • 12 ядер ЦПУ: 8 x Cortex-A57 + 4 x Denver

О по-настоящему мобильном применении такого компьютера нечего и мечтать — его энергопотребление составляет 250 Вт, как у топовой видеокарты GeForce GTX Titan X. Это довольно неожиданно с учетом гораздо более низкого энергопотребления у предшественника, Drive PX. 250 Вт конечно же требуют активного охлаждения, жидкостного в стандартной конфигурации, или воздушного в опциональной. Но при одинаковом энергопотреблении Drive PX 2 превосходит Titan X по производительности — согласно Nvidia в целых шесть раз:

Titan X Drive PX 2
Техпроцесс 28нм 16нм FinFET
 Архитектура ГПУ Maxwell Pascal
ЦПУ 4 x Nvidia Denver +
8 x ARM Cortex-A57
Операций с плавающей точкой (FP32) в секунду 7 Тфлопс 8 Тфлопс
Операций глубокого обучения в секунду 7 трлн 24 трлн
Скорость обучения в AlexNet 450 изображений в секунду 2,800 изображений в секунду
Энергопотребление 250 Вт 250 Вт

Как видим, 6-кратная разница в производительности основывается на данных скорости обучения в глубокой нейронной сети AlexNet.

Ведущий презентацию Джен-Сан Хуанг не преминул измерить быстродействие Drive PX 2 и в попугаях MacBook Pro — автомобильный суперкомпьютер якобы эквивалентен 150 топовым ноутбукам компании Apple. Правда, сделанные главой Nvidia расчеты представляются довольно спорными: 6 Titan X = 42 Тфлопс, Core i7 = 280 Гфлопс, 42 / 0.28 [Тфлопс] = 150. Так через 6-кратную разницу скорости обучения в AlexNet, Джен-Сан Хуанг ухитрился превратить заявленные им же 8 Тфлопс Drive PX 2 в 42 Тфлопс и тем самым «обосновать» его 150-кратное превосходство над MacBook Pro.

Заметим, что это не первый случай вольного обращения Nvidia с цифрами — на прошлогодней презентации Drive PX компания сравнила Tegra X1 с суперкомпьютером 1996 года ASCI Red, который первым достиг производительности 1 Тфлопс, но потреблял при этом 0.5 млн. Вт электроэнергии — в отличие от 15 Вт у Tegra X1. Между тем на самом деле речь идет о разных терафлопсах: в случае с ASCI Red он достигается в вычислениях с точностью FP64, а в случае с Tegra X1 — FP16.

Обучение навыкам вождения происходит при помощи разработанной Nvidia глубокой нейронной сети DriveNet. Впрочем она предназначена не только для Drive PX 2 и может использоваться на различных платформах, от дронов до графических станций и серверов, вроде анонсированной в марте 2015 Digits DevBox.

На нынешнем этапе DriveNet состоит из 37 миллионов нейронов (для сравнения количество нейронных клеток в головном мозге человека исчисляется десятками миллиардов, т.е. в тысячи раз больше) и способна одновременно выполнять 40 миллиардов операций. За месяц нейронная сеть прошла обучение на 120 миллионах объектов — без графических ускорителей этот процесс занял бы пару лет. И хотя как производитель видеокарт Nvidia подчеркивает значимость аппаратной платформы, главную роль в самообучении конечно же играет система искусственного интеллекта. Воспользовавшись вышеупомянутой платформой Digits (напомним, что она включает четыре видеокарты GeForce GTX Titan X) и швейцарской разработкой глубокого обучения, Audi всего за четыре часа обучения добилась 96% точности компьютерного распознавания дорожных знаков — это лучше, чем у человека. По мнению автопроизводителя, с использованием традиционных компьютерных алгоритмов процесс обучения занял бы целые годы.

И что самое главное — уже обученная система искусственного интеллекта свободно переносится на другую платформу. Например, Ford воспользовалась платформой Digits для интенсивного обучения своей глубокой нейронной сети распознаванию прохожих — прежде чем перенести её на автомобильный бортовой компьютер Drive PX. Nvidia рассчитывает, что у  каждого автопроизводителя будет облачный ресурс, куда от всех автомобилей будут собираться индивидуальные дорожные ситуации, на базе которых, в сочетании с мощной серверной платформой, будет происходить интенсивное обучение. А там как знать — возможно в перспективе производители объединят свои нейронные сети в общую систему искусственного интеллекта. Беспилотная система только что сошедшего с конвейерной линии автомобиля сможет сразу получить опыт миллионов автомобилей и миллиардов дорожных ситуаций, и расширять его с каждым обновлением бортового программного обеспечения — одновременно делясь своим индивидуальным опытом с остальными автомобилями.

Что касается непосредственно Drive PX 2, то первым его получит Volvo, славящаяся своей щепетильностью в отношении безопасности водителя и пассажиров. В 2017 году сто её беспилотных автомобилей начнут ездить по улицам Гётеборга, второго по величине города в Швеции.

В заключение заметим, что значение совершаемой на наших глазах революции в автомобильной индустрии трудно переоценить. По статистике 93% всех аварий происходит в силу человеческого фактора, унося 1.3 миллиона жизней ежегодно — население крупного города. В одних только США жители каждый год тратят на дорогу 5.5 миллиардов часов, что обходится американской экономике в $121 млрд. Конечно, даже тотальное оснащение всех автомобилей безопасными системами автопилота не избавит человека от необходимости тратить время на дорогу, но зато позволит занять его каким-то более содержательным занятием.

Еще более перспективной представляется развитие искусственного интеллекта как такового. Не исключено, что система автопилота станет своего рода пилотным проектом, на котором со временем будут отрабатываться глубокие нейронные сети в области распознавания человеческой речи, медицинской диагностики и т.д. Работы в этих областях идут полным ходом, но именно в автомобильной индустрии эти разработки приобретают все более масштабный характер.

Запись сегодняшней пресс-конференции доступна на сайте компании, а также (по частям) на её канале в YouTube.

Nvidia