AMD Instinct MI60: вероятная производительность PlayStation 5

AMD Instinct MI60

Несколько месяцев назад я высказал предположение (едва ли оригинальное), что PlayStation 5 выйдет в 2020 году и получит ГПУ от AMD с 7-нм литографией и производительностью на уровне 12-15 терафлопс (FP32). Прошедшая на этой конференция AMD Next Horizon Event с моей точки зрения косвенно это предположение подтверждает. Вообще она была посвящена облачным дата-центрам, особенностью которых является большая производительность и параллельные вычисления. Для них AMD представила два графических ускорителя, Instinct MI60 и Instinct MI50, со следующими характеристиками:

Instinct MI60 Instinct MI50
ГПУ Vega 20
Техпроцесс TSMC 7-нм
Энергопотребление 300 Вт
Кол-во ядер (потоковых процессоров) 4,096 3,840
Пиковая тактовая частота 1800 МГц 1746 МГц
Производительность
FP32 14.7 терафлопс 12.6 терафлопс
FP64 7.4 терафлопс 6.7 терафлопс
FP16 29.5 терафлопс 26.8 терафлопс
INT8 58.9 терафлопс 53.6 терафлопс
Память
Тип HBM2
Объем 32 Гб 16 Гб
Разрядность 4096
Пропускная способность 1024 Гб/с

Это первые в мире графические ускорители не только с 7-нм техпроцессом, но также пропускной способностью 1 Тб/с и поддержкой PCIe 4.0. Новинки являются преемниками анонсированного в декабре 2016 года графического ускорителя Instinct MI25. Тот имеет 14-нм литографию (GloFo), архитектуру Vega, 4096 ядер (потоковых процессоров) и скорость 12.3 терафлопс (FP32) при энергопотреблении 300 Вт.

Согласно AMD, переход на 7-нм обеспечил:

  • ×1.25 рост производительности при прежнем уровне энергопотребления (хотя с точки зрения производительности в FP32 получается чуть меньше ×1.20)
  • ×0.5 снижение энергопотребления при прежнем уровне производительности
  • ×2 увеличение плотности транзисторов.

Вполне разумно рассчитывать, что ГПУ представленных 6 ноября графических ускорителей со временем доберутся и до игровых видеокарт, с перспективой их использования в консолях следующего поколения. В этом отношении наибольший интерес вызывают объявленные на конференции характеристики первого в мире дискретного ГПУ на базе 7-нанометрового техпроцесса (TSMC) и архитектуры Vega, MI60. Кристалл площадью 331 мм2 получил 13.28 млрд. транзисторов и скорость в 14.7 терафлопс (FP32).

AMD MI60

Ниже приводятся характеристики ГПУ от MI60 и трех самых топовых, на сегодня, ГПУ от Nvidia и AMD. Прямое сравнение между ними, из-за разницы в архитектурах (особенно Nvidia) и производителях техпроцесса не вполне корректно, но зато иллюстрирует общие преимущества перехода на 7-нм техпроцесс. Для наглядности эти данные сопровождаются процентом от максимального значения (GV100):

Vega 20 Vega 10 TU102 GV100
Производитель AMD Nvidia
Техпроцесс TSMC 7-нм GloFo 14-нм TSMC 12-нм
Архитектура Vega Turing Volta
Площадь кристалла 331 мм2
(38%)
486 мм2
(56%)
754 мм2
(87%)
871 мм2
Кол-во транзисторов 13.3 млрд
(63%)
13.6 млрд
(65%)
18.6 млрд
(89%)
21 млрд
Производительность (FP32) 14.7 терафлопс
(99%)
12.6 терафлопс
(85%)
14.2 терафлопс
(96%)
14.8 терафлопс

Надо заметить, что графическую производительность вообще и игровую в частности такой показатель как скорость операций с плавающей точкой иллюстрирует очень косвенно, без учета числа растровых (ROP) и тензорных (TMU) блоков, их фактической производительности и т.д. Достаточно сравнить между собой игровое быстродействие двух видеокарт с ГПУ TU102 и Vega 10 (на разрешении 4K, с максимальными настройками, по данным AnandTech):

RTX 2080 Ti (FE) Radeon RX Vega 64
ГПУ TU102 Vega 10
Кол-во транзисторов 18.6 млрд 12.5 млрд (67%)
Кол-во ядер 4,352 (из 4,608) 4,096 (94%)
Производительность (FP32) 14.2 терафлопс
12.6 терафлопс
(89%)
Кол-во ROP 88 (из 96) 64 (73%)
Кол-во TMU 272 (из 288) 256 (94%)
Battlefield 1 102 к/с 59 к/с (58%)
Far Cry 5 73 к/с 45 к/с (62%)
Ashes of the Singularity: Escalation 90 к/с 59 к/с (66%)
Wolfenstein II: The New Colossus 127 к/с 69 к/с (54%)
Final Fantasy XV 61 к/с 31 к/с (51%)
Grand Theft Auto V 65 к/с 31 к/с (48%)
Middle-earth: Shadow of War 74 к/с 42 к/с (57%)
F1 2018 101 к/с 61 к/с (60%)
Total War: Warhammer II 57 к/с 29 к/с (51%)

Как видим, если в операциях с плавающей точкой производительность Radeon RX Vega 64 достигает 89% от RTX 2080 Ti, то в играх она колеблется от 48% до 66%.

Поэтому каким окажется игровое быстродействие Vega 20 сказать сложно. Но если исходить из того, что его аналогом будут оснащены игровые приставки следующего поколения, то по меньшей мере это дает представление об их производительности в FP32 — около 13-15 терафлопс.

Также напомню, что согласно утечкам дорожной карты ГПУ AMD, первое поколение её игровых видеокарт с 7-нм техпроцессом будет иметь архитектуру Navi и по быстродействию соответствовать ГПУ Vega 10. Тогда в таблице выше мы видим перед собой их приблизительную производительность — а также, вероятно, производительность будущих преемников PlayStation 4 и Xbox One. В этом случае они явно не будут дотягивать до нативного разрешения 4K с 60 к/с.

RTX 2080 Ti & 2080

В свою очередь видеокарты, которые до этого уровня дотягивают, стоят слишком дорого для того, чтобы их компоненты использовать в игровых приставках. Первые ревизии Xbox One и PlayStation 4 имеют цену в $400, а видеокарты GTX 1080 Ti и RTX 2080 Ti — $700 и $1200 соответственно. Прибавьте к этой сумме стоимость:

  • достойного таких видеокарт процессора Intel Core i7-9700K (мелкооптовая цена — $374),
  • оперативной памяти (16 Гб — около $200),
  • накопителей SSD/HDD и
  • прочих комплектующих игрового ПК,

и вы получите конфигурацию на сумму $2-3 тыс. Так что быстродействие уровня видеокарты Radeon RX Vega 64 (13 терафлопс) через два года, когда может состояться релиз PlayStation 5, представляется не самым плохим вариантом.

Кроме того, нельзя исключать, что AMD воспользуется собственным аналогом DLSS от Nvidia. Как уже рассказывал Gadgets News, в соответствии с этой технологией графика генерируется на относительно низком разрешении, а потом апскейлится с прорисовкой соседних пикселей при помощи машинного обучения. Главное, чтобы рост производительности по сравнению с игровыми консолями нынешнего поколения позволил разработчикам поднять игры на принципиально другой уровень. Не будем забывать, что недавно выпущенная Red Dead Redemption 2 с её впечатляющей графикой может запускаться даже на ранних ревизиях Xbox One с PlayStation 4, производительность которых в FP32 не превышает 2 терафлопс.