Nvidia анонсировала Quadro GP100

Опубликовано 14:57 06.02.201715:19 06.02.2017 автором Егор Ликоспастов

Сегодня Nvidia анонсировала несколько новых моделей из семейства графических карт Quadro для рабочих станций: GP100, P4000, P2000, P1000, P600 и P400. Всех их объединяет новейшая архитектура Pascal, которая практически целиком представлена в серии новейших игровых видеокарт GeForce (от GTX 1080 до GTX 1050). Как вы наверное заметили, самая старшая из сегодняшних новинок называется по имени установленного в ней ГПУ, GP100.

Напомню, что оно также используется в графическом ускорителе Tesla P100. В этом смысле название Quadro GP100 выглядит не вполне последовательно, но очевидно обусловлено желанием избежать ассоциаций с более младшими моделями (P600 и P400). Понятие «графический ускоритель» и «графическая карта» довольно условны — принципиально семейство Tesla от Quadro и GeForce отличается отсутствием текстурных (TMU) и растровых (ROP) блоков, т.е. для непосредственно графических задач оно не предназначено. Но в Quadro GP100 установлена конечно та версия ГПУ, в которой TMU и ROP есть. Еще одной отличительной особенностью Quadro GP100 является наличие кулера, тогда как Tesla P100 предназначен для установки в сервер с собственной системой охлаждения.

Сравнительные характеристики карты и её предшественников выглядят так:

	GP100	P6000	M6000	K6000
Начало продаж	Март 2017	Октябрь 2016	Март 2016	Июль 2013
TDP	235 Вт	250 Вт	250 Вт	225 Вт
Техпроцесс	TSMC 16нм	TSMC 16нм	TSMC 28нм	TSMC 28нм
Архитектура	Pascal	Pascal	Maxwell 2	Kepler
ГПУ	GP100	GP102	GM200	GK110
Кол-во ядер	3,584	3,840	3,072	2,880
Производительность FP32	10.3 терафлопс	12 терафлопс	7 терафлопс	5.2 терафлопс
FP64	1/2 FP32	1/32 FP32	1/32 FP32	1/3 FP32
Кол-во TMU	224	240	192	240
Кол-во ROP	128(?)	96	96	48
Повышенная частота	~1430 МГц	~1560 МГц	~1140 МГц
Память	HBM2 1.4 Гбит/с	GDDR5X 9 Гбит/с	GDDR5 6.6 Гбит/с	GDDR5 6 Гбит/с
Разрядность памяти	4096-бит	384-бит	384-бит	384-бит
Объем памяти	16 Гб	24 Гб	24 Гб	12 Гб
ECC	+	—	—	+

Любопытно, что несмотря на то, что по сравнению с GP102 у GP100 больший размер кристалла (610 мм² vs 471 мм²) и больше транзисторов (15.3 млрд vs 12 млрд), первый содержит меньше ядер с TMU и соответственно менее производителен. Это связано с тем, что номинально у обоих ГПУ одинаковое количество ядер CUDA (3,840), но на GP100 часть из них отключена. При этом конфигурация этих двух ГПУ между собой отличается: стриминговые микропроцессоры (SM) GP100 содержат по 64 ядра, а GP102 — по 128 ядер. При этом у GP100 более крупный кеш второго уровня (4,096 Кб vs 3,072 Кб), другой стандарт видеопамяти (HBM2 vs GDDR5X), имеется контроллер шины NVLINK.

А главное — GP100 прекрасно масштабируется в вычислениях с точностью FP16 (производительность удваивается и достигает 20.7 терафлопс) и FP64 (уменьшается в два раза до 5.2 терафлопс). В ГПУ GP102 (и соответственно в графическом ускорителе P6000) эти пропорции с 2:1 и 1:2 меняются на 1:64 и 1:32. Таким образом, разница в производительности FP16 и FP64 между GP100 и GP102 составляет (если для упрощения считать одинаковым быстродействие FP32) соответственно 128 и 16 раз! Так что в вычислениях с половинной и двойной точностью разница между Quadro GP100 и Quadro P6000 просто огромная.

Что касается остальных анонсированных сегодня моделей, то у них следующие характеристики:

	P4000	P2000	P1000	P600	P400
TDP	105 Вт	75 Вт	47 Вт	40 Вт	30 Вт
ГПУ	GP104	GP106	GP107	GP107	GP107
Кол-во ядер	1,792	1,024	640	384	256
Повышенная частота	~1480 МГц	~1470 МГц	~1400 МГц	~1430 МГц	~1270 МГц
Производительность FP32	5.3 терафлопс	3 терафлопс	1.894 терафлопс	1.195 терафлопс	0.641 терафлопс
Память	8 Гб GDDR5	5 Гб GDDR5	4 Гб GDDR5	2 Гб GDDR5	2 Гб GDDR5

Самая младшая из этих моделей, Quadro P400, по количеству ядер и производительности вполне соответствует представленному два года назад мобильному чипсету Tegra X1.

Nvidia, AnandTech (1), (2)

Nvidia анонсировала Quadro GP100

Добавить комментарий Отменить ответ

Рубрики