AMD Radeon RX 7900 XTX: на $200 более дешевая альтернатива для Nvidia GeForce RTX 4080

Позавчера состоялась долгожданная презентация AMD, на которой компания представила свой ответ анонсированной почти месяц назад серии Nvidia GeForce RTX 40 — топовые видеокарты Radeon RX 7900 XTX и Radeon RX 7900 XT. Их особенность:

  1. чиплетная компоновка (один чиплет с графическим ядрами площадью 306мм2 и шесть чиплетов с кешем памяти, каждый площадью 37.5 мм2) с огромной пропускной способностью обмена данными между чиплетами (5.3 Тб/с);
  2. новый техпроцесс (5-нм — у графического чиплета, 6-нм — у чиплетов с кешем памяти);
  3. новая графическая архитектура RDNA 3
  4. встроенная поддержка стандарта сжатия видео AV1 (помимо H.264 и H.265).

Ниже приводятся характеристики двух новых моделей от AMD в сравнении с двумя новейшими видеокартами Nvidia, в скобках — спецификации предшественников, Radeon RX 6950 XT и Radeon RX 6900 XT:

Radeon RX 7900 XTXRadeon RX 7900 XTGeForce RTX 4090GeForce RTX 4080 1
Цена$1 тыс
($1.1 тыс)
$900
($1 тыс)
$1.6 тыс$1.2 тыс
Начало продаждекабрь 2022
(май 2022)
декабрь 2022
(декабрь 2020)
октябрь 2022ноябрь 2022
Энергопотребление355 Вт
(335 Вт)
300 Вт
(300 Вт)
450 Вт320 Вт
АрхитектураRDNA 3
(RDNA 2)
RDNA 3
(RDNA 2)
Ada LovelaceAda Lovelace
Техпроцесс5/6 нм TSMC
(7 нм TSMC)
5/6 нм TSMC
(7 нм TSMC)
4 нм TSMC4 нм TSMC
Площадь306 + (6 x 37.5) мм2
(520 мм2)
306 + (6 x 37.5) мм2
(520 мм2)
608.4 мм2378.6 мм2
Кол-во транзисторов58 млрд
(26.8 млрд)
58 млрд
(26.8 млрд)
76.3 млрд45.9 млрд
Кол-во ядер6,144 2
(5,120)
5,376 2
(5,120)
16,3849,728
Тактовая частота (базовая/игровая/пиковая)1.9/2.3/2.5 ГГц
(1.89/2.10/2.31 ГГц)
1.5/2.0/2.4 ГГц
(1.825/2.015/2.250 ГГц)
2.23/-/2.52 ГГц2.21/-/2.51 ГГц
Кол-во тексельных блоков (TMU)384
(320)
336
(320)
512304
Тексельная производительность (на пиковой частоте)960 Гтекс/с
(739.2 Гтекс/с)
810 Гтекс/с
(720 Гтекс/с)
1,290 Гтекс/с761.5 Гтекс/с
Кол-во растровых блоков (ROP)192
(128)
192
(128)
176112
Пиксельная производительность (на пиковой частоте)480 Гпикс/с
(295.7 Гпикс/с)
460 Гпикс/с
(288 Гпикс/с)
443.5 Гпикс/с280.6 Гпикс/с
Кол-во блоков трассировки лучей96
(80)
84
(80)
12876
Кол-во тензорных блоков512304
Память24 Гб GDDR6, 960 Гб/с
(16 Гб GDDR6, 576 Гб/с)
20 Гб GDDR6, 800 Гб/с
(16 Гб GDDR6, 512 Гб/с)
24 Гб GDDR6X, 1,008 Гб/с16 Гб GDDR6X, 735.7 Гб/с
Кэш L296 Мб
(128 Мб)
80 Мб
(128 Мб)
72 Мб64 Мб
Производительность в операциях с плавающей точкой (FP32, на пиковой частоте)61 TFLOPS
(23.65 TFLOPS)
52 TFLOPS
(23.04 TFLOPS)
82.58 TFLOPS48.74 TFLOPS

1 Изначально Nvidia анонсировала две модификации, с 16 Гб ($1.2 тыс) и 12 Гб ($900) видеопамяти, но спустя несколько дней после презентации 12 Гб версия была отменена

Для наглядность сведем в одну таблицу все показатели, касающиеся производительности четырех самых топовых на сегодня видеокарт. В скобках — процент от максимального значения в таблице соответствующего показателя (выделен жирным):

Radeon RX 7900 XTXRadeon RX 7900 XTGeForce RTX 4090GeForce RTX 4080
В операциях с плавающей точкой 161 TFLOPS52 TFLOPS
(85%)
52.58 TFLOPS
(86%)
31.19 TFLOPS
(51%)
Тексельная960 Гтекс/с
(74%)
810 Гтекс/с
(63%)
1,290 Гтекс/с761.5 Гтекс/с
(59%)
Пиксельная480 Гпикс/с460 Гпикс/с
(96%)
443.5 Гпикс/с
(92%)
280.6 Гпикс/с
(58%)
Пропускная способность памяти960 Гб/с
(95%)
800 Гб/с
(79%)
1,008 Гб/с735.7 Гб/с
(73%)

1 В случае с видеокартами Nvidia — с поправкой на 36%. Как уже рассказывал Gadgets News, в документации к архитектуре Turing говорится, что в среднем в играх 36% FP-ядер задействованы в целочисленных ядрах. Если это справедливо и для архитектуры Ada Lovelace, то в случае с Nvidia RTX 4090 получается 53 вместо 83 TFLOPS.

2 Судя по всему, ядра (шейдерные процессоры) RDNA 3 представляют собой удвоенную версию ядер RDNA 2.

В следующей таблице представлен прирост производительности новых видеокарт AMD по сравнению с предшественниками:

Radeon RX 7900 XTXRadeon RX 7900 XT
В операциях с плавающей точкой2.6x2.3x
Тексельная+30%+13%
Пиксельная+62%+60%
Пропускная способность памяти+67%+56%

Как видим, номинальный прирост производительности и пропускной способности видеопамяти у новых видеокарт в целом получился значительным, за исключением тексельной скорости. Как результат, по последнему показателю Nvidia RTX 4090 превосходит AMD RX 7900 XTX на треть. А вот пиксельная производительность у RTX 4090 даже немного меньше (на 8%).

Сама AMD приводит следующие данные по производительности AMD RX 7900 XTX и её предшественника, которые в таблице дополнены результатами тестов, сделанных нашими коллегами из TechSpot (выделены синим шрифтом):

На нативном 4K разрешении

AMD RX 6950 XTAMD RX 7900 XTXNvidia RTX 4090
Watch Dogs: Legion88 к/с1.5x = 132 к/с141 к/с
Cyberpunk 207749 к/с1.7x = 83 к/с83 к/с

С трассировкой лучей, на разрешении 4K и при максимальных настройках

AMD RX 6950 XTAMD RX 7900 XTXNvidia RTX 4090
Dying Light 239 к/с
35 к/с
72 к/с101 к/с
Cyberpunk 207742 к/с
49 к/с
62 к/с83 к/с

Приведенные в последней таблице данные взяты из результатов, которые соответствуют значениям, названным AMD в отношении AMD RX 6950 XT. Непосредственно у TechSpot производительность этой карты в игре Cyberpunk 2077 с включенной трассировкой лучей и технологией масштабирования FSR составляет 27 к/с, а 49 к/с в таблице — это, напротив, с отключенной трассировкой лучей. Но если в качестве отправной точки взять значения из презентации AMD (заявленные для включенной трассировки лучей), то производительность Nvidia RTX 4090 по сравнению с AMD RX 7900 XTX оказывается выше на 34-40%. Зато в играх, где трассировка лучей отключена (согласно AMD, по умолчанию), у RX 7900 XTX получается примерно одинаковая производительность с RTX 4090. Реальная игровая производительность RX 7900 XTX наверняка окажется ниже, что вполне официально подтверждает сама AMD. В интервью PCWorld главный архитектор ПО подразделения Gaming Solutions компании, Фрэнк Азор (Frank Azor), сказал следующее:

[Radeon RX 7900 XTX] ($1 тыс) предназначен для соперничества с 4080 ($1.2 тыс), а у нас нет бенчмарков по 4080. Это основная причина, почему вы не увидели сравнения с Nvidia. … Видеокарта за 999 долларов — это не соперник 4090 ($1.6 тыс), который стоит на 60% дороже, это соперник 4080.

Первые результаты тестов новых видеокарт AMD следует ожидать 13 декабря, когда стартуют их продажи. В следующем году компания обещает выпустить 3-е поколение технологии апскейла FSR, которое до двух раз повысит производительность (количество к/с) по сравнению с FSR 2. Таким образом, FSR 3 станет ответом AMD на разработанную Nvidia технологию DLSS 3, значительно повысившую число кадров в секунду по сравнению с DLSS 2 (например, в Cyberpunk 2077 — на 43%). Кстати, в вышеупомянутом интервью Фрэнк Азор опровергнул мнение, что FSR 3 разработана в ответ на DLSS 3. По словам топ-менеджера AMD, в компании давно работают над FSR, при этом технология может работать на разных поколениях видеокарт AMD и даже на видеокартах других производителей (как уже рассказывал Gadgets News, DLSS 3 эксклюзивно поддерживается на видеокартах серии Nvidia RTX 40). А это, по словам Азора, «экспоненциально сложнее». Также AMD заявляет, что используемая в RX 7900 XTX и RX 7900 XT архитектура RDNA 3 по сравнению с RDNA 2 до 1.8 раз повысит производительность в играх с трассировкой лучей.

Если резюмировать эти очень предварительные и исходящие в основном от производителя данные, то в играх без использования трассировки лучей AMD RX 7900 XTX сулит производительность, сопоставимую по меньшей мере с Nvidia RTX 4080. В перспективе, с релизом FSR 3, в играх с трассировкой лучей возможно также будет достигнут относительный паритет с Nvidia. Главный козырь топовой видеокарты AMD — её цена: $1 тыс против $1.2 тыс за Nvidia RTX 4080.

С использованием данных AMD (1), (2) и PCWorld