Nvidia анонсировала Quadro P6000 и P5000

Quadro P6000

Компания Nvidia представила очередные видеокарты с техпроцессом 16нм FinFET и архитектурой Pascal. На этот раз речь идет о моделях, предназначенных не для игр, а для профессионального использования в рабочих станциях — Quadro P6000 и P5000. В них используются ГПУ, уже знакомые нам по игровым Titan X (GP102), GeForce GTX 1080 и GTX 1070 (GP 104). Ниже представлены характеристики Quadro P6000 и P5000, а также моделей, представляющих всю серию существующих на сегодня ГПУ с архитектурой Pascal, от младшей GP106 до старшей GP100:

GTX 1060 Quadro P5000 Titan X Quadro P6000 Tesla P100 (PCI-Express) Tesla P100 (NVLINK)
ГПУ GP106 GP104 GP102 GP102 GP100 GP100
Площадь кристалла 200 мм² 314 мм² 471 мм² 471 мм² 610 мм² 610 мм²
TDP 120 Вт 180 Вт 250 Вт 250 Вт 250 Вт 300 Вт
Кол-во транзисторов 4.4 млрд 7.2 млрд 12.0 млрд 12.0 млрд 15.3 млрд 15.3 млрд
Кол-во ядер FP32 1,280 2,560 3,584 3,840 3,584 3,584
Кол-во ядер FP64 1/32 1/32 1/32 1/32 1/2 1/2
Кол-во TMU 80 160 224 240 (?)
Кол-во ROP 48 64 96 96 (?)
Производительность (FP32) 4.4 терафлопс 8.9 терафлопс 10.97 терафлопс 12 терафлопс 9.3 терафлопс 10.6 терафлопс
Частота базовая 1506 МГц ? 1417 МГц ? 1205 МГц 1328 МГц
Частота ускоренная 1708 МГц 1740 МГц (?) 1530 МГц 1560 МГц (?) 1300 МГц 1480 МГц
Память 6 Гб
GDDR5
16 Гб
GDDR5X
12 Гб
GDDR5X
24 Гб
GDDR5X
16 Гб
HBM2
16 Гб
HBM2
Разрядность шины памяти 192-бит 256-бит 384-бит 384-бит 4096-бит 4096-бит
Пропускная способность памяти 192 Гб/с 256 Гб/с 480 Гб/с 480 Гб/с 720 Гб/с 720 Гб/с
Начало продаж июль 2016 октябрь 2016 август 2016 октябрь 2016 IV кв 2016 I кв 2017

Напомню, что профессиональные видеокарты серии Quadro предназначены для визуальных задач, тогда как Tesla — для научных вычислений. Соответственно последние не имеют ROP c TMU (растровых и текстурных блоков) и не подходят для графики. Любопытно, что несмотря на использование в Quadro P6000 более младшей, по сравнению с Tesla P100, версии ГПУ (GP102 vs GP100), ядер CUDA в ней больше (3,840 vs 3,584). Это связано с тем, что в ГПУ видеокарты Tesla P100 четыре SM (стриминговых мультипроцессоров) отключены — номинально GP100 содержит 60 SM (стриминговых мультипроцессоров) по 64 ядер, т.е. всего 3,840 ядер. Поэтому в будущем вполне возможен релиз моделей на базе GP100 с еще большим, по сравнению с Tesla P100, количеством ядер.

Также уместно было бы сравнить Quadro P6000 и P5000 с их непосредственными предшественниками, Quadro M6000 и M5000:

P6000 P5000 M6000 M5000
Техпроцесс TSMC 16нм TSMC 16нм TSMC 28нм TSMC 28нм
Архитектура Pascal Pascal Maxwell Maxwell
ГПУ GP102 GP104 GM200 GM204
TDP 250 Вт 180 Вт 250 Вт 150 Вт
Кол-во транзисторов 12 млрд 7.2 млрд 8 млрд 5.2 млрд
Кол-во ядер FP32 3,840 2,560 3,072 2,048
Кол-во ядер FP64 120 80 96 64
Кол-во TMU 240 (?) 160 192 128
Кол-во ROP 96 (?) 64 96 64
Производительность (FP32) 12 терафлопс 8.9 терафлопс 7 терафлопс 4.3 терафлопс
Частота базовая ? ?
Частота ускоренная 1560 МГц (?) 1740 МГц (?) ~1140 МГц ~1050 МГц
Память 24 Гб
GDDR5X
16 Гб
GDDR5X
24 Гб
GDDR5
8 Гб
GDDR5
Частота памяти 9 Гбит/с 9 Гбит/с 6.6 Гбит/с 6.6 Гбит/с
Разрядность шины памяти 384-бит 256-бит 384-бит 256-бит
Пропускная способность памяти 480 Гб/с 256 Гб/с 317 Гб/с 211 Гб/с
Начало продаж октябрь 2016 октябрь 2016 22.03.2016 11.08.2015
Цена ? ? $5,000 $2,000

Сегодня же конкурент Nvidia, компания AMD, представила первую серию профессиональных видеокарт Radeon Pro WX с архитектурой Polaris и три входящие в неё модели, 41005100 и 7100. Подробнее о них мы расскажем в своем следующем материале.

Nvidia с использованием данных WCCFtech и AnandTech