Birentech раскрыла новые подробности о ГПУ Biren BR100

Опубликовано 23:59 22.08.202217:37 23.08.2022 автором Егор Ликоспастов

Пару недель назад китайская компания Birentech анонсировала графический ускоритель Biren BR100, а сегодня в рамках конференции Hot Chips 34 раскрыла о нем новые подробности. Вот как на сегодня выглядят полные характеристики одного из самых производительных в мире ГПУ — в таблице снизу они приводятся вместе с Nvidia H100:

	Biren BR100 (Birentech)	H100 (Nvidia)
Техпроцесс	7 нм TSMC	4 нм TSMC
Площадь кристалла	1074 мм² (два чиплета)	814 мм²
Кол-во транзисторов	77 млрд	80 млрд
Кэш L2	256 Мб	50 Мб
Кэш L1	8 Мб	33 Мб
Память	64 Гб HBM2E (1.64 Тб/с)	80 Гб HBM3 (3 Тб/с)
Производительность	FP32: 256 TFLOPS BF16: 1014 TFLOPS INT8: 2048 TOPS	FP32: 60 (500) TFLOPS BF16: 120 (1000) TFLOPS INT8: 2000 TOPS
TDP	550 Вт	700 Вт
Интерфейс с другими графическими ускорителями (пропускная способность)	BLink (512 Гб/с)	NVLink 4 (450 Гб/с)

По всей видимости, заявленное для Biren BR100 быстродействие относится к тензорным вычислениям, поэтому для Nvidia H100 в скобках приведены аналогичные данные. Сама Birentech сравнивает свой графический ускоритель не с H100 (анонсирован в марте 2022), а с его предшественником A100 (май 2020):

Таким образом, превосходство Biren BR100 над Nvidia A100 является 2.4-2.8-кратным. Что касается H100, то согласно Nvidia разница в его производительности с предшественником, A100, в некоторых задачах (например, инференс, т.е. вывод данных из модели) является 30-кратной. Но даже создание достойного соперника для топового графического ускорителя 2-летней давности является для Китая большим достижением. Тем более, что сравнение с устаревшей Nvidia A100 на вышеупомянутой конференции Hot Chips 34 предпочла сделать даже Intel — при том, что её графический ускоритель Ponte Vecchio Xe-HPC (52 TFLOPS FP32, L1 — 64 Мб, L2 — 408 Мб) еще не поступил в продажу.

Wccftech

Birentech раскрыла новые подробности о ГПУ Biren BR100

Добавить комментарий Отменить ответ

Рубрики