AMD Instinct MI60: вероятная производительность PlayStation 5
Несколько месяцев назад я высказал предположение (едва ли оригинальное), что PlayStation 5 выйдет в 2020 году и получит ГПУ от AMD с 7-нм литографией и производительностью на уровне 12-15 терафлопс (FP32). Прошедшая на этой конференция AMD Next Horizon Event с моей точки зрения косвенно это предположение подтверждает. Вообще она была посвящена облачным дата-центрам, особенностью которых является большая производительность и параллельные вычисления. Для них AMD представила два графических ускорителя, Instinct MI60 и Instinct MI50, со следующими характеристиками:
Instinct MI60 | Instinct MI50 | |
ГПУ | Vega 20 | |
Техпроцесс | TSMC 7-нм | |
Энергопотребление | 300 Вт | |
Кол-во ядер (потоковых процессоров) | 4,096 | 3,840 |
Пиковая тактовая частота | 1800 МГц | 1746 МГц |
Производительность | ||
FP32 | 14.7 терафлопс | 12.6 терафлопс |
FP64 | 7.4 терафлопс | 6.7 терафлопс |
FP16 | 29.5 терафлопс | 26.8 терафлопс |
INT8 | 58.9 терафлопс | 53.6 терафлопс |
Память | ||
Тип | HBM2 | |
Объем | 32 Гб | 16 Гб |
Разрядность | 4096 | |
Пропускная способность | 1024 Гб/с |
Это первые в мире графические ускорители не только с 7-нм техпроцессом, но также пропускной способностью 1 Тб/с и поддержкой PCIe 4.0. Новинки являются преемниками анонсированного в декабре 2016 года графического ускорителя Instinct MI25. Тот имеет 14-нм литографию (GloFo), архитектуру Vega, 4096 ядер (потоковых процессоров) и скорость 12.3 терафлопс (FP32) при энергопотреблении 300 Вт.
Согласно AMD, переход на 7-нм обеспечил:
- ×1.25 рост производительности при прежнем уровне энергопотребления (хотя с точки зрения производительности в FP32 получается чуть меньше ×1.20)
- ×0.5 снижение энергопотребления при прежнем уровне производительности
- ×2 увеличение плотности транзисторов.
Вполне разумно рассчитывать, что ГПУ представленных 6 ноября графических ускорителей со временем доберутся и до игровых видеокарт, с перспективой их использования в консолях следующего поколения. В этом отношении наибольший интерес вызывают объявленные на конференции характеристики первого в мире дискретного ГПУ на базе 7-нанометрового техпроцесса (TSMC) и архитектуры Vega, MI60. Кристалл площадью 331 мм2 получил 13.28 млрд. транзисторов и скорость в 14.7 терафлопс (FP32).
Ниже приводятся характеристики ГПУ от MI60 и трех самых топовых, на сегодня, ГПУ от Nvidia и AMD. Прямое сравнение между ними, из-за разницы в архитектурах (особенно Nvidia) и производителях техпроцесса не вполне корректно, но зато иллюстрирует общие преимущества перехода на 7-нм техпроцесс. Для наглядности эти данные сопровождаются процентом от максимального значения (GV100):
Vega 20 | Vega 10 | TU102 | GV100 | |
Производитель | AMD | Nvidia | ||
Техпроцесс | TSMC 7-нм | GloFo 14-нм | TSMC 12-нм | |
Архитектура | Vega | Turing | Volta | |
Площадь кристалла | 331 мм2 (38%) |
486 мм2 (56%) |
754 мм2 (87%) |
871 мм2 — |
Кол-во транзисторов | 13.3 млрд (63%) |
13.6 млрд (65%) |
18.6 млрд (89%) |
21 млрд — |
Производительность (FP32) | 14.7 терафлопс (99%) |
12.6 терафлопс (85%) |
14.2 терафлопс (96%) |
14.8 терафлопс — |
Надо заметить, что графическую производительность вообще и игровую в частности такой показатель как скорость операций с плавающей точкой иллюстрирует очень косвенно, без учета числа растровых (ROP) и тензорных (TMU) блоков, их фактической производительности и т.д. Достаточно сравнить между собой игровое быстродействие двух видеокарт с ГПУ TU102 и Vega 10 (на разрешении 4K, с максимальными настройками, по данным AnandTech):
RTX 2080 Ti (FE) | Radeon RX Vega 64 | |
ГПУ | TU102 | Vega 10 |
Кол-во транзисторов | 18.6 млрд | 12.5 млрд (67%) |
Кол-во ядер | 4,352 (из 4,608) | 4,096 (94%) |
Производительность (FP32) | 14.2 терафлопс — |
12.6 терафлопс (89%) |
Кол-во ROP | 88 (из 96) | 64 (73%) |
Кол-во TMU | 272 (из 288) | 256 (94%) |
Battlefield 1 | 102 к/с | 59 к/с (58%) |
Far Cry 5 | 73 к/с | 45 к/с (62%) |
Ashes of the Singularity: Escalation | 90 к/с | 59 к/с (66%) |
Wolfenstein II: The New Colossus | 127 к/с | 69 к/с (54%) |
Final Fantasy XV | 61 к/с | 31 к/с (51%) |
Grand Theft Auto V | 65 к/с | 31 к/с (48%) |
Middle-earth: Shadow of War | 74 к/с | 42 к/с (57%) |
F1 2018 | 101 к/с | 61 к/с (60%) |
Total War: Warhammer II | 57 к/с | 29 к/с (51%) |
Как видим, если в операциях с плавающей точкой производительность Radeon RX Vega 64 достигает 89% от RTX 2080 Ti, то в играх она колеблется от 48% до 66%.
Поэтому каким окажется игровое быстродействие Vega 20 сказать сложно. Но если исходить из того, что его аналогом будут оснащены игровые приставки следующего поколения, то по меньшей мере это дает представление об их производительности в FP32 — около 13-15 терафлопс.
Также напомню, что согласно утечкам дорожной карты ГПУ AMD, первое поколение её игровых видеокарт с 7-нм техпроцессом будет иметь архитектуру Navi и по быстродействию соответствовать ГПУ Vega 10. Тогда в таблице выше мы видим перед собой их приблизительную производительность — а также, вероятно, производительность будущих преемников PlayStation 4 и Xbox One. В этом случае они явно не будут дотягивать до нативного разрешения 4K с 60 к/с.
В свою очередь видеокарты, которые до этого уровня дотягивают, стоят слишком дорого для того, чтобы их компоненты использовать в игровых приставках. Первые ревизии Xbox One и PlayStation 4 имеют цену в $400, а видеокарты GTX 1080 Ti и RTX 2080 Ti — $700 и $1200 соответственно. Прибавьте к этой сумме стоимость:
- достойного таких видеокарт процессора Intel Core i7-9700K (мелкооптовая цена — $374),
- оперативной памяти (16 Гб — около $200),
- накопителей SSD/HDD и
- прочих комплектующих игрового ПК,
и вы получите конфигурацию на сумму $2-3 тыс. Так что быстродействие уровня видеокарты Radeon RX Vega 64 (13 терафлопс) через два года, когда может состояться релиз PlayStation 5, представляется не самым плохим вариантом.
Кроме того, нельзя исключать, что AMD воспользуется собственным аналогом DLSS от Nvidia. Как уже рассказывал Gadgets News, в соответствии с этой технологией графика генерируется на относительно низком разрешении, а потом апскейлится с прорисовкой соседних пикселей при помощи машинного обучения. Главное, чтобы рост производительности по сравнению с игровыми консолями нынешнего поколения позволил разработчикам поднять игры на принципиально другой уровень. Не будем забывать, что недавно выпущенная Red Dead Redemption 2 с её впечатляющей графикой может запускаться даже на ранних ревизиях Xbox One с PlayStation 4, производительность которых в FP32 не превышает 2 терафлопс.