Новинки Nvidia: Tesla P40, Tesla P4 и одночиповый DRIVE PX 2

Сегодня, в рамках пекинской выставки GTC 2016, компания Nvidia представила несколько своих новинок. В первую очередь это видеокарты (или точнее выражаясь, ускорители) Tesla P40 и Tesla P4, преемники прошлогодних Tesla M40 и M4. Если Tesla P100 предназначена в основном для тренировки систем искусственного интеллекта (training), то 40-я и 4-я серии больше подходят для конечного принятия решений уже обученными системами (inference) — например, распознавания конкретного изображения или конкретной голосовой команды.

Как видно из литеры «P», архитектура Maxwell в ГПУ этих моделей сменилась на Pascal, и соответственно вместо 28нм техпроцесса используется 16нм. Заметно выросла частота., а объем памяти увеличился в два раза. Все это способствовало 1.7-2.5-кратному росту производительности при прежнем энергопотреблении. Еще одним существенным нововведением стало оснащение вычислительных ядер возможностью производить целочисленные 8-разрядные вычисления — у Tesla M40 и M4 её не было. В Tesla P40 используется ГПУ GP102 (им же оснащены TITAN X с Quadro P6000), а в Tesla P4 — GP104 (GTX 1080, GTX 1070 и Quadro P5000). Предлагаем вашему вниманию полные характеристики новинок и их предшественников:

Tesla M4 Tesla P4 Tesla M40 Tesla P40
TDP 50/75 Вт 75 Вт (50 Вт опционально) 250 Вт 250 Вт
Техпроцесс 28-нм 16-нм 28-нм 16-нм
Кол-во транзисторов 2.9 млрд 7.2 млрд 8 млрд 12 млрд
ГПУ GM206 GP104 GM200 GP102
Площадь ГПУ 227 мм² 314 мм² 601 мм² 471 мм²
Кол-во SM 8 20 24 30
Кол-во ядер FP32 1,024 2,560 3,072 3,840
Частота базовая 872 МГц 810 МГц 948 МГц 1303 МГц
Частота ускоренная 1072 МГц 1063 МГц 1114 МГц 1531 МГц
Производительность INT8 (TOPS) 21.8 47.0
Производительность FP32 (терафлопс) 2.2 5.4 6.8 11.8
Производительность FP64 (гигафлопс) 69 170 213 367
Кол-во TMU (текстурных блоков) 64 160 192 240
Память GDDR5
128-бит
GDDR5
256-бит
GDDR5
384-бит
GDDR5
384-бит
Пропускная способность памяти 88 Гб/с 192 Гб/с 288 Гб/с 346 Гб/с
Объем памяти 4 Гб 8 Гб 12/24 Гб 24 Гб
Объем кэш L2 2048 Кб 2048 Кб 3072 Кб 3072 Кб
Объем файла-регистра 2048 Кб 5120 Кб 6144 Кб 7680 Кб
Объем распределенной памяти на SM 96 Кб 128 Кб 96 Кб 128 Кб

В продажу Tesla P40 и Tesla P4 поступят в октябре и ноябре соответственно, цены не называются.

drive-px-2-new

Другой новинкой сегодняшней презентации стала одночиповая версия компьютера DRIVE PX 2. Напомню, что в стандартной комплектации он оснащен двумя дискретными видеокартами (предположительно уровня GTX 1060) и двумя мобильными процессорами Tegra, каждый из которых содержит 6-ядерное ЦПУ (4 x Cortex-A57 + 2 x Denver 2) и 256-ядерное ГПУ. Такое же количество ядер в ГПУ самого производительного мобильного процессора Nvidia, анонсированного в январе 2015 Tegra X1 с архитектурой Maxwell. Поэтому фактически речь, судя по всему, идет о его преемнике с архитектурой Pascal. Официально Nvidia его в качестве мобильного процессора не анонсировала — с недавних пор компания утратила интерес к мобильным устройствам. Однако с учетом вполне умеренного, по сравнению с изначальным DRIVE PX 2 (250 Вт), энергопотребления одночиповой версии (10 Вт), не исключено появление процессора Tegra Pascal в будущих версиях игровых консолей Shield Tablet (2014) и Shield Android TV (2015).

Nvidia позиционирует облегченную версию DRIVE PX 2 для автопилота на загородных магистралях, тогда как полная версия позволит ездит на автопилоте «от точки до точки». Одночиповый DRIVE PX 2 в распоряжение партнеров Nvidia будет предоставлен в IV квартале этого года.

specs_window_image_last

Ну и конец третьей главной новостью стал анонс Jetpack 2.3 — очередной версии программного пакета для программирования аппаратной платформы Jetson TX1. Согласно Nvidia, обновление позволит повысить скорость принятия решений (inference) в два раза.

Nvidia (1), (2), (3)