Nvidia анонсировала Quadro GP100

Сегодня Nvidia анонсировала несколько новых моделей из семейства графических карт Quadro для рабочих станций: GP100, P4000, P2000, P1000, P600 и P400. Всех их объединяет новейшая архитектура Pascal, которая практически целиком представлена в серии новейших игровых видеокарт GeForce (от GTX 1080 до GTX 1050). Как вы наверное заметили, самая старшая из сегодняшних новинок называется по имени установленного в ней ГПУ, GP100.

Напомню, что оно также используется в графическом ускорителе Tesla P100. В этом смысле название Quadro GP100 выглядит не вполне последовательно, но очевидно обусловлено желанием избежать ассоциаций с более младшими моделями (P600 и P400). Понятие «графический ускоритель» и «графическая карта» довольно условны — принципиально семейство Tesla от Quadro и GeForce отличается отсутствием текстурных (TMU) и растровых (ROP) блоков, т.е. для непосредственно графических задач оно не предназначено. Но в Quadro GP100 установлена конечно та версия ГПУ, в которой TMU и ROP есть. Еще одной отличительной особенностью Quadro GP100 является наличие кулера, тогда как Tesla P100 предназначен для установки в сервер с собственной системой охлаждения.

Сравнительные характеристики карты и её предшественников выглядят так:

GP100 P6000 M6000 K6000
 Начало продаж Март 2017 Октябрь 2016 Март 2016 Июль 2013
 TDP 235 Вт 250 Вт 250 Вт 225 Вт
 Техпроцесс TSMC 16нм TSMC 16нм TSMC 28нм TSMC 28нм
 Архитектура Pascal Pascal Maxwell 2 Kepler
 ГПУ GP100 GP102 GM200 GK110
 Кол-во ядер 3,584 3,840 3,072 2,880
 Производительность FP32 10.3
терафлопс
12
терафлопс
7
терафлопс
5.2
терафлопс
 FP64 1/2 FP32 1/32 FP32 1/32 FP32 1/3 FP32
 Кол-во TMU 224 240 192 240
 Кол-во ROP 128(?) 96 96 48
 Повышенная частота ~1430 МГц ~1560 МГц ~1140 МГц
 Память HBM2
1.4 Гбит/с
GDDR5X
9 Гбит/с
GDDR5
6.6 Гбит/с
GDDR5
6 Гбит/с
 Разрядность памяти 4096-бит 384-бит 384-бит 384-бит
 Объем памяти 16 Гб 24 Гб 24 Гб 12 Гб
 ECC + +

Любопытно, что несмотря на то, что по сравнению с GP102 у GP100 больший размер кристалла (610 мм² vs 471 мм²) и больше транзисторов (15.3 млрд vs 12 млрд), первый содержит меньше ядер с TMU и соответственно менее производителен. Это связано с тем, что номинально у обоих ГПУ одинаковое количество ядер CUDA (3,840), но на GP100 часть из них отключена. При этом конфигурация этих двух ГПУ между собой отличается: стриминговые микропроцессоры (SM) GP100 содержат по 64 ядра, а GP102 — по 128 ядер. При этом у GP100 более крупный кеш второго уровня (4,096 Кб vs 3,072 Кб), другой стандарт видеопамяти (HBM2 vs GDDR5X), имеется контроллер шины NVLINK.

А главное — GP100 прекрасно масштабируется в вычислениях с точностью FP16 (производительность удваивается и достигает 20.7 терафлопс) и FP64 (уменьшается в два раза до 5.2 терафлопс). В ГПУ GP102 (и соответственно в графическом ускорителе P6000) эти пропорции с 2:1 и 1:2 меняются на 1:64 и 1:32. Таким образом, разница в производительности FP16 и FP64 между GP100 и GP102 составляет (если для упрощения считать одинаковым быстродействие FP32) соответственно 128 и 16 раз! Так что в вычислениях с половинной и двойной точностью разница между Quadro GP100 и Quadro P6000 просто огромная.

Что касается остальных анонсированных сегодня моделей, то у них следующие характеристики:

P4000 P2000 P1000 P600 P400
 TDP 105 Вт 75 Вт 47 Вт 40 Вт 30 Вт
 ГПУ GP104 GP106 GP107 GP107 GP107
 Кол-во ядер 1,792 1,024 640 384 256
 Повышенная частота ~1480 МГц ~1470 МГц ~1400 МГц ~1430 МГц ~1270 МГц
 Производительность FP32 5.3
терафлопс
3
терафлопс
1.894
терафлопс
1.195
терафлопс
0.641
терафлопс
 Память 8 Гб GDDR5 5 Гб GDDR5 4 Гб GDDR5 2 Гб GDDR5 2 Гб GDDR5

Самая младшая из этих моделей, Quadro P400, по количеству ядер и производительности вполне соответствует представленному два года назад мобильному чипсету Tegra X1.

Nvidia, AnandTech (1), (2)