Nvidia представила Jetson TX2
Три года назад, в первые дни 2014, Nvidia анонсировала Tegra K1 (со 192-ядерным ГПУ архитектуры Kepler), который позиционировался компанией в качестве мобильного процессора с десктопным, уровня Xbox 360 и PS3, быстродействием. К сожалению устройств с ним вышло совсем немного, но зато в марте того же года Nvidia представила Jetson TK1 — фактический готовый мини-компьютер на базе Tegra K1, который разработчики могли использовать по собственному усмотрению. Спустя полтора года, в ноябре 2015, был анонсирован Jetson TX1 (на базе Tegra X1), а сегодня Nvidia представила 3-е поколение, Jetson TX2.
Как и его непосредственный предшественник, Jetson TX2 оснащен 256-ядерным ГПУ, но теперь на смену Maxwell пришла архитектура Pascal, а максимально возможная тактовая частота выросла с 998 МГц до 1302 МГц. Последнее стало осуществимым в том числе благодаря переходу с 20-нм техпроцесса на 16-нм (в Tegra K1 применен 28-нм).
Заметно улучшились характеристики и ЦПУ: вместо четырех ядер Cortex-A57 с тактовой частотой 1.73 ГГц теперь имеем четверку Cortex-A57 с частотой до 2 ГГц и пару фирменных ядер Denver2 с частотой до 2 ГГц.
Одновременно выросли объем (с 4 Гб до 8 Гб) и частота (с 1600 МГц до 1866 МГц) оперативной памяти LPDDR4, а также её разрядность (128-бит vs 64-бит) и пропускная способность (с 25.6 Гб/с до 58.3 Гб/с). Объем флеш-памяти eMMC 5.1 также увеличился в два раза, с 16 Гб до 32 Гб.
Как и прежде, размеры мини-компьютера — 50 x 87 мм (чуть меньше банковской карты), вес — 85 граммов.
Jetson TX2 способен работать в трех режимах, в зависимости от которых растет (в частности в задачах для нейронный сетей) либо производительность, либо эффективность. Как именно — позволяет оценить таблица ниже:
Jetson TX1 | Jetson TX2 | ||||
---|---|---|---|---|---|
Max Clock (998 МГц) |
Max-Q (854 МГц) |
max-P (1122 МГц) |
Max Clock (1302 МГц) |
||
GoogLeNet (пакет = 2) |
Производительность | 141 к/с | 138 к/с | 176 к/с | 201 к/с |
Энергопотребление (AP+DRAM) | 9.14 Вт | 4.8 Вт | 7.1 Вт | 10.1 Вт | |
Эффективность | 15.42 | 28.6 | 24.8 | 19.9 | |
GoogLeNet (пакет = 128) |
Производительность | 204 к/с | 196 к/с | 253 к/с | 290 к/с |
Энергопотребление (AP+DRAM) |
11.7 Вт | 5.9 Вт | 8.9 Вт | 12.8 Вт | |
Эффективность | 17.44 | 33.2 | 28.5 | 22.7 | |
AlexNet (пакет = 2) |
Производительность | 164 к/с | 178 к/с | 222 к/с | 250 к/с |
Энергопотребление (AP+DRAM) | 8.5 Вт | 5.6 Вт | 7.8 Вт | 10.7 Вт | |
Эффективность | 19.3 | 32 | 28.3 | 23.3 | |
AlexNet (пакет = 128) |
Производительность | 505 к/с | 463 к/с | 601 к/с | 692 к/с |
Энергопотребление (AP+DRAM) | 11.3 Вт | 5.6 Вт | 8.6 Вт | 12.4 Вт | |
Эффективность | 44.7 | 82.7 | 69.9 | 55.8 |
Nvidia не преминула сравнить свой мини-компьютер с процессорами Intel — согласно компании, Jetson TX2 обходит даже Xeon E5-2690 v4, чье энергопотребление при решении задач машинного обучения в 9-15 раз выше.
Если сравнивать с более профильным железом, то на ноябрь 2015 видеокарта Titan X (Maxwell) в тесте GoogLeNet показывала быстродействие на уровне 863 изображений в секунду при 225 Вт энергопотребления, т.е. 3.8 изображений в секунду на один ватт потребляемой энергии. У Jetson TX2 этот показатель составляет 33.2 изображений/с/Вт, т.е. почти в 9 раз больше, чем у Titan X и почти в 2 раза больше, чем у Jetson TX1. В абсолютном выражении при максимальном энергопотреблении в 12.4 Вт производительность Jetson TX2 расчетно составит 411.8 изображений в секунду, т.е. всего в два раза меньше, чем у самой топовой игровой видеокарты 2-летней давности. В своих выкладках я исхожу из равных параметров тестирования Jetson TX2 и Titan X (пакеты по 128 изображений, точность FP32) и не учитываю рост производительности за счет более эффективного программного обеспечения.
В любом случае прогресс по сравнению с предыдущей версией мини-компьютера Jetson налицо, чему наверняка обрадуются создатели роботов, главных кандидатов на использование аппаратной платформы для распознавания изображений. Продажи Jetson TX2 начнутся в апреле по оптовой (от тысячи штук) цене $399 — на $100 дороже Jetson TX1.