AMD Instinct MI100: первый ускоритель с производительностью 11.5 TFLOPS FP64
Сегодня AMD представила свой новый ускоритель для высокопроизводительных серверов, Instinct MI100. Как заявляет компания, это первый в мире ускоритель с производительностью до 11.5 TFLOPS в операциях с плавающей точкой двойной точности (FP64). В таблице ниже — характеристики и производительность (TFLOPS) новинки, её предшественника двухлетней давности, Instinct MI50 (чей старший «брат» Instinct MI60 пропал с сайта AMD и никогда не продавался), а также самого производительного из ускорителей Nvidia:
Instinct MI100 | Instinct MI50 | A100 | |
TDP | 300 Вт | 300 Вт | 400 Вт |
Техпроцесс | 7 нм TSMC | 7 нм TSMC | 7 нм TSMC |
Архитектура | CDNA | Vega 20 | Ampere |
Кол-во ядер (потоковых процессоров) | 7,680 | 3,840 | 6,912 |
Тактовая частота (максимальная) | 1502 МГц | 1746 МГц | 1410 МГц |
Память, пропускная способность | 32 Гб HBM2 1.229 Тб/с | 16/32 Гб HBM2 1.024 Тб/с | 40 Гб HBM2e 1.6 Тб/с |
FP64 | 11.5 | 6.6 | 9.7 |
FP32 | 23.1 | 13.3 | 19.5 |
FP16 | 184.6 | 26.5 | 78 |
BF16 (bfloat16) | 92.3 | ? | 39 |
INT8 | 184.6 | 53 | ? |
Instinct MI100 поддерживает технологию Matrix Core, благодаря которой его скорость в операциях FP32, FP16, bFloat 16, INT8 и INT4 значительно возрастает. Например, в FP32 она удваивается, с 23 до 46 TFLOPS. Впрочем, аналогичная технология Nvidia показывает еще более выдающийся результат — в FP32 она взлетает в 8 раз, с 19,5 до 156 TFLOPS. Поэтому сравнение, которое AMD делает в своей презентации, не вполне корректно:
Свой новый ускоритель AMD сравнила с суперкомпьютером, созданным IBM двадцать лет назад. Я дополнил это сравнение данными по самому производительному из нынешних суперкомпьютеров (с которым десктопные ускорители возможно сравняются еще через двадцать лет):
Instinct MI100 | ASCI White | Fugaku (Fujitsu) | |
Релиз | 2020 | 2001 | 2020 |
Цена (стоимость разработки) | ? 1 | $110 млн ($163 млн в нынешних ценах) | $910 млн |
Вес | 1.16 кг | 106 т | 700 т |
Энергопотребление | 300 Вт | 6 мВт | 28 мВт |
Пиковая производительность (FP64) | 11.5 TFLOPS | 12.3 TFLOPS | 514 PFLOPS |
1 Для сравнения, цена Nvidia A100 — $12.5 тыс.
Цена и конкретные сроки релиза AMD Instinct MI100 не называются,