Nvidia представила Jetson TX2

Три года назад, в первые дни 2014, Nvidia анонсировала Tegra K1 (со 192-ядерным ГПУ архитектуры Kepler), который позиционировался компанией в качестве мобильного процессора с десктопным, уровня Xbox 360 и PS3, быстродействием. К сожалению устройств с ним вышло совсем немного, но зато в марте того же года Nvidia представила Jetson TK1 — фактический готовый мини-компьютер на базе Tegra K1, который разработчики могли использовать по собственному усмотрению. Спустя полтора года, в ноябре 2015, был анонсирован Jetson TX1 (на базе Tegra X1), а сегодня Nvidia представила 3-е поколение, Jetson TX2.

Как и его непосредственный предшественник, Jetson TX2 оснащен 256-ядерным ГПУ, но теперь на смену Maxwell пришла архитектура Pascal, а максимально возможная тактовая частота выросла с 998 МГц до 1302 МГц. Последнее стало осуществимым в том числе благодаря переходу с 20-нм техпроцесса на 16-нм (в Tegra K1 применен 28-нм).

Заметно улучшились характеристики и ЦПУ: вместо четырех ядер Cortex-A57 с тактовой частотой 1.73 ГГц теперь имеем четверку Cortex-A57 с частотой до 2 ГГц и пару фирменных ядер Denver2 с частотой до 2 ГГц.

Одновременно выросли объем (с 4 Гб до 8 Гб) и частота (с 1600 МГц до 1866 МГц) оперативной памяти LPDDR4, а также её разрядность (128-бит vs 64-бит) и пропускная способность (с 25.6 Гб/с до 58.3 Гб/с). Объем флеш-памяти eMMC 5.1 также увеличился в два раза, с 16 Гб до 32 Гб.

Как и прежде, размеры мини-компьютера — 50 x 87 мм (чуть меньше банковской карты), вес — 85 граммов.

Jetson TX2 способен работать в трех режимах, в зависимости от которых растет (в частности в задачах для нейронный сетей) либо производительность, либо эффективность. Как именно — позволяет оценить таблица ниже:

Jetson TX1 Jetson TX2
Max Clock
(998 МГц)
Max-Q
(854 МГц)
max-P
(1122 МГц)
Max Clock
(1302 МГц)
GoogLeNet
(пакет = 2)
Производительность 141 к/с 138 к/с 176 к/с 201 к/с
Энергопотребление (AP+DRAM) 9.14 Вт 4.8 Вт 7.1 Вт 10.1 Вт
Эффективность 15.42 28.6 24.8 19.9
GoogLeNet
(пакет = 128)
Производительность 204 к/с 196 к/с 253 к/с 290 к/с
Энергопотребление
(AP+DRAM)
11.7 Вт 5.9 Вт 8.9 Вт 12.8 Вт
Эффективность 17.44 33.2 28.5 22.7
AlexNet
(пакет = 2)
Производительность 164 к/с 178 к/с 222 к/с 250 к/с
Энергопотребление (AP+DRAM) 8.5 Вт 5.6 Вт 7.8 Вт 10.7 Вт
Эффективность 19.3 32 28.3 23.3
AlexNet
(пакет = 128)
Производительность 505 к/с 463 к/с 601 к/с 692 к/с
Энергопотребление (AP+DRAM) 11.3 Вт 5.6 Вт 8.6 Вт 12.4 Вт
Эффективность 44.7 82.7 69.9 55.8

Nvidia не преминула сравнить свой мини-компьютер с процессорами Intel — согласно компании, Jetson TX2 обходит даже Xeon E5-2690 v4, чье энергопотребление при решении задач машинного обучения в 9-15 раз выше.

Если сравнивать с более профильным железом, то на ноябрь 2015 видеокарта Titan X (Maxwell) в тесте GoogLeNet показывала быстродействие на уровне 863 изображений в секунду при 225 Вт энергопотребления, т.е. 3.8 изображений в секунду на один ватт потребляемой энергии. У Jetson TX2 этот показатель составляет 33.2 изображений/с/Вт, т.е. почти в 9 раз больше, чем у Titan X и почти в 2 раза больше, чем у Jetson TX1. В абсолютном выражении при максимальном энергопотреблении в 12.4 Вт производительность Jetson TX2 расчетно составит 411.8 изображений в секунду, т.е. всего в два раза меньше, чем у самой топовой игровой видеокарты 2-летней давности. В своих выкладках я исхожу из равных параметров тестирования Jetson TX2 и Titan X (пакеты по 128 изображений, точность FP32) и не учитываю рост производительности за счет более эффективного программного обеспечения.

В любом случае прогресс по сравнению с предыдущей версией мини-компьютера Jetson налицо, чему наверняка обрадуются создатели роботов, главных кандидатов на использование аппаратной платформы для распознавания изображений. Продажи Jetson TX2 начнутся в апреле по оптовой (от тысячи штук) цене $399 — на $100 дороже Jetson TX1.

Nvidia (1), (2), (3)