Nvidia анонсировала Quadro GP100
Сегодня Nvidia анонсировала несколько новых моделей из семейства графических карт Quadro для рабочих станций: GP100, P4000, P2000, P1000, P600 и P400. Всех их объединяет новейшая архитектура Pascal, которая практически целиком представлена в серии новейших игровых видеокарт GeForce (от GTX 1080 до GTX 1050). Как вы наверное заметили, самая старшая из сегодняшних новинок называется по имени установленного в ней ГПУ, GP100.
Напомню, что оно также используется в графическом ускорителе Tesla P100. В этом смысле название Quadro GP100 выглядит не вполне последовательно, но очевидно обусловлено желанием избежать ассоциаций с более младшими моделями (P600 и P400). Понятие «графический ускоритель» и «графическая карта» довольно условны — принципиально семейство Tesla от Quadro и GeForce отличается отсутствием текстурных (TMU) и растровых (ROP) блоков, т.е. для непосредственно графических задач оно не предназначено. Но в Quadro GP100 установлена конечно та версия ГПУ, в которой TMU и ROP есть. Еще одной отличительной особенностью Quadro GP100 является наличие кулера, тогда как Tesla P100 предназначен для установки в сервер с собственной системой охлаждения.
Сравнительные характеристики карты и её предшественников выглядят так:
GP100 | P6000 | M6000 | K6000 | |
Начало продаж | Март 2017 | Октябрь 2016 | Март 2016 | Июль 2013 |
TDP | 235 Вт | 250 Вт | 250 Вт | 225 Вт |
Техпроцесс | TSMC 16нм | TSMC 16нм | TSMC 28нм | TSMC 28нм |
Архитектура | Pascal | Pascal | Maxwell 2 | Kepler |
ГПУ | GP100 | GP102 | GM200 | GK110 |
Кол-во ядер | 3,584 | 3,840 | 3,072 | 2,880 |
Производительность FP32 | 10.3 терафлопс |
12 терафлопс |
7 терафлопс |
5.2 терафлопс |
FP64 | 1/2 FP32 | 1/32 FP32 | 1/32 FP32 | 1/3 FP32 |
Кол-во TMU | 224 | 240 | 192 | 240 |
Кол-во ROP | 128(?) | 96 | 96 | 48 |
Повышенная частота | ~1430 МГц | ~1560 МГц | ~1140 МГц | |
Память | HBM2 1.4 Гбит/с |
GDDR5X 9 Гбит/с |
GDDR5 6.6 Гбит/с |
GDDR5 6 Гбит/с |
Разрядность памяти | 4096-бит | 384-бит | 384-бит | 384-бит |
Объем памяти | 16 Гб | 24 Гб | 24 Гб | 12 Гб |
ECC | + | — | — | + |
Любопытно, что несмотря на то, что по сравнению с GP102 у GP100 больший размер кристалла (610 мм² vs 471 мм²) и больше транзисторов (15.3 млрд vs 12 млрд), первый содержит меньше ядер с TMU и соответственно менее производителен. Это связано с тем, что номинально у обоих ГПУ одинаковое количество ядер CUDA (3,840), но на GP100 часть из них отключена. При этом конфигурация этих двух ГПУ между собой отличается: стриминговые микропроцессоры (SM) GP100 содержат по 64 ядра, а GP102 — по 128 ядер. При этом у GP100 более крупный кеш второго уровня (4,096 Кб vs 3,072 Кб), другой стандарт видеопамяти (HBM2 vs GDDR5X), имеется контроллер шины NVLINK.
А главное — GP100 прекрасно масштабируется в вычислениях с точностью FP16 (производительность удваивается и достигает 20.7 терафлопс) и FP64 (уменьшается в два раза до 5.2 терафлопс). В ГПУ GP102 (и соответственно в графическом ускорителе P6000) эти пропорции с 2:1 и 1:2 меняются на 1:64 и 1:32. Таким образом, разница в производительности FP16 и FP64 между GP100 и GP102 составляет (если для упрощения считать одинаковым быстродействие FP32) соответственно 128 и 16 раз! Так что в вычислениях с половинной и двойной точностью разница между Quadro GP100 и Quadro P6000 просто огромная.
Что касается остальных анонсированных сегодня моделей, то у них следующие характеристики:
P4000 | P2000 | P1000 | P600 | P400 | |
TDP | 105 Вт | 75 Вт | 47 Вт | 40 Вт | 30 Вт |
ГПУ | GP104 | GP106 | GP107 | GP107 | GP107 |
Кол-во ядер | 1,792 | 1,024 | 640 | 384 | 256 |
Повышенная частота | ~1480 МГц | ~1470 МГц | ~1400 МГц | ~1430 МГц | ~1270 МГц |
Производительность FP32 | 5.3 терафлопс |
3 терафлопс |
1.894 терафлопс |
1.195 терафлопс |
0.641 терафлопс |
Память | 8 Гб GDDR5 | 5 Гб GDDR5 | 4 Гб GDDR5 | 2 Гб GDDR5 | 2 Гб GDDR5 |
Самая младшая из этих моделей, Quadro P400, по количеству ядер и производительности вполне соответствует представленному два года назад мобильному чипсету Tegra X1.