Nvidia представила новое поколение видеокарт и миникомпьютер для запуска больших языковых моделей
Сегодня, спустя более чем двух лет после анонса первых представителей семейства RTX 40, в рамках CES 2025 Nvidia анонсировала очередное поколение своих видеокарт, RTX 50 (для ПК и ноутбуков). Вот как выглядят характеристики представленных сегодня моделей (в скобках — изменения по сравнению с предшественниками):
RTX 5090 | RTX 5080 | RTX 5070 Ti | RTX 5070 | |
Цена | $2 тыс ($1.6 тыс) | $1 тыс ($1.2 тыс) | $750 ($800) | $550 ($600) |
Энергопотребление | 575 Вт (450 Вт) | 360 Вт (320 Вт) | 300 Вт (285 Вт) | 250 Вт (200 Вт) |
Архитектура | Blackwell (Ada Lovelace) | Blackwell (Ada Lovelace) | Blackwell (Ada Lovelace) | Blackwell (Ada Lovelace) |
ГПУ, площадь | GB202, 377 мм² (AD102, 609 мм²) | GB203, 377 мм² (AD103, 379 мм²) | GB203, 377 мм² (AD104, 294 мм²) | GB205, ? (AD104, 294 мм²) |
Кол-во транзисторов | 92 млрд (76.3 млрд) | ? (45.9 млрд) | ? (35.8 млрд) | ? (35.8 млрд) |
Кол-во ядер | 21,760 (16,384) | 10,752 (9,728) | 8,960 (7,680) | 6,144 (5,888) |
Кол-во тензорных / трассировочных ядер | 680 (512) 170 (128) | 336 (304) 84 (76) | 280 (240) 70 (60) | 192 (184) 48 (46) |
Кол-во TMU / ROP | 680 (512) 192 (176) | 336 (304) 128 (112) | 280 (240) 128 (80) | 192 (184) 64 (64) |
Тактовая частота пиковая | 2407 МГц (2520 МГц) | 2617 МГц (2505 МГц) | 2475 МГц (2610 МГц) | 2520 МГц (2475 MHz) |
Производительность текстурная | 1,637 Гтекс/с (1290.2 Гтекс/с) | 879.3 Гтекс/с (761.5 Гтекс/с) | 693.0 Гтекс/с (626.4 Гтекс/с) | 483.8 Гтекс/с (455.4 Гтекс/с) |
Производительность пиксельная | 462.1 Гпикс/с (443.5 Гпикс/с) | 335.0 Гпикс/с (280.6 Гпикс/с) | 316.8 Гпикс/с (208.8 Гпикс/с) | 161.3 Гпикс/с (158.4 Гпикс/с) |
Производительность FP32 (TFLOPS) | 104.80 (82.58) | 56.28 (48.74) | 44.35 (40.09) | 30.97 (29.15) |
ИИ производительность (TOPS) | 3,352 (1,321) | 1,801 (836) | 1,406 (641) | 988 (568) |
Объем памяти | 32 Гб GDDR7 (24 Гб GDDR6X) | 16 Гб GDDR7 (16 Гб GDDR6X) | 16 Гб GDDR7 (12 Гб GDDR6X) | 12 Гб GDDR7 (12 Гб GDDR6X) |
Пропускная способность памяти | 1.79 Тб/с (1.01 Тб/с) | 960.0 Гб/с (716.8 Гб/с) | 896.3 Гб/с (504.2 Гб/с) | 672.2 Гб/с (504.2 GB/s) |
Согласно представленным Nvidia графикам, по сравнению со своими непосредственными предшественниками новые видеокарты в некоторых играх (включая Cyberpunk 2077) показывают двухкратный рост производительности — при включенных трассировке лучей и DLSS. Вместе с новыми видеокартами Nvidia представила 4-е поколение этой технологии, DLSS 4, которое не поддерживается более ранними моделями. Производительность видеокарт в играх определяется как раз частотой кадров в секунду, а отличие DLSS 4 от более ранних версий состоит в том, что она дорисовывает не только пиксели в кадре (для масштабирования в более высокое разрешение), но и сами кадры. Наши коллеги из Eurogamer на примере RTX 5080 и RTX 4080 подтвердили почти двухкратный рост производительности новых видеокарт. Отрисовка дополнительных кадров технологией DLSS 4 объясняет и заявленное Nvidia тождество игровой производительности RTX 5070 и RTX 4090 при почти 3-кратной разнице в цене.
В основе DLSS 4 лежат технологии искусственного интеллекта, и как можно видеть из таблицы, в этих вычислениях производительность новых видеокарт значительно выросла: у RTX 5090 — в 2.5 раза, у RTX 5080 и RTX 5070 Ti — в 2 раза, у RTX 5070 — в 1.7 раз.
Нельзя не отметить и прогресс производительности в операциях с плавающей точкой. У топовой RTX 5090 она достигает почти 105 TFLOPS FP32 — в 3 раза больше, чем у вышедшей два месяца назад PlayStation 5 Pro и в 10 раз больше, чем у вышедшей четыре года назад .PlayStation 5.
Релиз RTX 5090 и RTX 5080 состоится 30 января, а двух остальных моделей — в феврале.
Еще одна интересная новинка сегодняшней презентации — Project DIGITS. Это миникомпьютер, оснащенный 20-ядерным ЦПУ Grace с архитектурой ARM, ГПУ с архитектурой Blackwell и производительностью 1 петафлопс (FP4), 128 Гб оперативной памяти DDR5X и диском SSD емкостью 4 Тб. Согласно Nvidia, производительности мини-ПК хватит для инференса моделей с количеством параметров до 200 млрд. Для сравнения, самый производительный на сегодня графический ускоритель Nvidia, B200, имеет производительность в 40 раз больше — 40 петафлопс с точностью FP4. Но если Nvidia B200 стоит от $30 тыс до $40 тыс, то Project DIGITS — $3 тыс. Цена не включает НДС, и кроме того Project DIGITS за пределами США наверняка будет продаваться с наценкой, не говоря уже о перекупщиках. Но даже за $4-5 тыс долларов этот миникомпьютер вполне по карману высокооплачиваемым специалистам и энтузиастам, которые хотели бы поработать с достаточно крупной опенсорсной моделью на своем домашнем ПК.