AMD Radeon RX 7900 XTX: на $200 более дешевая альтернатива для Nvidia GeForce RTX 4080
Позавчера состоялась долгожданная презентация AMD, на которой компания представила свой ответ анонсированной почти месяц назад серии Nvidia GeForce RTX 40 — топовые видеокарты Radeon RX 7900 XTX и Radeon RX 7900 XT. Их особенность:
- чиплетная компоновка (один чиплет с графическим ядрами площадью 306мм2 и шесть чиплетов с кешем памяти, каждый площадью 37.5 мм2) с огромной пропускной способностью обмена данными между чиплетами (5.3 Тб/с);
- новый техпроцесс (5-нм — у графического чиплета, 6-нм — у чиплетов с кешем памяти);
- новая графическая архитектура RDNA 3
- встроенная поддержка стандарта сжатия видео AV1 (помимо H.264 и H.265).
Ниже приводятся характеристики двух новых моделей от AMD в сравнении с двумя новейшими видеокартами Nvidia, в скобках — спецификации предшественников, Radeon RX 6950 XT и Radeon RX 6900 XT:
Radeon RX 7900 XTX | Radeon RX 7900 XT | GeForce RTX 4090 | GeForce RTX 4080 1 | |
Цена | $1 тыс ($1.1 тыс) | $900 ($1 тыс) | $1.6 тыс | $1.2 тыс |
Начало продаж | декабрь 2022 (май 2022) | декабрь 2022 (декабрь 2020) | октябрь 2022 | ноябрь 2022 |
Энергопотребление | 355 Вт (335 Вт) | 300 Вт (300 Вт) | 450 Вт | 320 Вт |
Архитектура | RDNA 3 (RDNA 2) | RDNA 3 (RDNA 2) | Ada Lovelace | Ada Lovelace |
Техпроцесс | 5/6 нм TSMC (7 нм TSMC) | 5/6 нм TSMC (7 нм TSMC) | 4 нм TSMC | 4 нм TSMC |
Площадь | 306 + (6 x 37.5) мм2 (520 мм2) | 306 + (6 x 37.5) мм2 (520 мм2) | 608.4 мм2 | 378.6 мм2 |
Кол-во транзисторов | 58 млрд (26.8 млрд) | 58 млрд (26.8 млрд) | 76.3 млрд | 45.9 млрд |
Кол-во ядер | 6,144 2 (5,120) | 5,376 2 (5,120) | 16,384 | 9,728 |
Тактовая частота (базовая/игровая/пиковая) | 1.9/2.3/2.5 ГГц (1.89/2.10/2.31 ГГц) | 1.5/2.0/2.4 ГГц (1.825/2.015/2.250 ГГц) | 2.23/-/2.52 ГГц | 2.21/-/2.51 ГГц |
Кол-во тексельных блоков (TMU) | 384 (320) | 336 (320) | 512 | 304 |
Тексельная производительность (на пиковой частоте) | 960 Гтекс/с (739.2 Гтекс/с) | 810 Гтекс/с (720 Гтекс/с) | 1,290 Гтекс/с | 761.5 Гтекс/с |
Кол-во растровых блоков (ROP) | 192 (128) | 192 (128) | 176 | 112 |
Пиксельная производительность (на пиковой частоте) | 480 Гпикс/с (295.7 Гпикс/с) | 460 Гпикс/с (288 Гпикс/с) | 443.5 Гпикс/с | 280.6 Гпикс/с |
Кол-во блоков трассировки лучей | 96 (80) | 84 (80) | 128 | 76 |
Кол-во тензорных блоков | — | — | 512 | 304 |
Память | 24 Гб GDDR6, 960 Гб/с (16 Гб GDDR6, 576 Гб/с) | 20 Гб GDDR6, 800 Гб/с (16 Гб GDDR6, 512 Гб/с) | 24 Гб GDDR6X, 1,008 Гб/с | 16 Гб GDDR6X, 735.7 Гб/с |
Кэш L2 | 96 Мб (128 Мб) | 80 Мб (128 Мб) | 72 Мб | 64 Мб |
Производительность в операциях с плавающей точкой (FP32, на пиковой частоте) | 61 TFLOPS (23.65 TFLOPS) | 52 TFLOPS (23.04 TFLOPS) | 82.58 TFLOPS | 48.74 TFLOPS |
1 Изначально Nvidia анонсировала две модификации, с 16 Гб ($1.2 тыс) и 12 Гб ($900) видеопамяти, но спустя несколько дней после презентации 12 Гб версия была отменена
Для наглядность сведем в одну таблицу все показатели, касающиеся производительности четырех самых топовых на сегодня видеокарт. В скобках — процент от максимального значения в таблице соответствующего показателя (выделен жирным):
Radeon RX 7900 XTX | Radeon RX 7900 XT | GeForce RTX 4090 | GeForce RTX 4080 | |
В операциях с плавающей точкой 1 | 61 TFLOPS | 52 TFLOPS (85%) | 52.58 TFLOPS (86%) | 31.19 TFLOPS (51%) |
Тексельная | 960 Гтекс/с (74%) | 810 Гтекс/с (63%) | 1,290 Гтекс/с | 761.5 Гтекс/с (59%) |
Пиксельная | 480 Гпикс/с | 460 Гпикс/с (96%) | 443.5 Гпикс/с (92%) | 280.6 Гпикс/с (58%) |
Пропускная способность памяти | 960 Гб/с (95%) | 800 Гб/с (79%) | 1,008 Гб/с | 735.7 Гб/с (73%) |
1 В случае с видеокартами Nvidia — с поправкой на 36%. Как уже рассказывал Gadgets News, в документации к архитектуре Turing говорится, что в среднем в играх 36% FP-ядер задействованы в целочисленных ядрах. Если это справедливо и для архитектуры Ada Lovelace, то в случае с Nvidia RTX 4090 получается 53 вместо 83 TFLOPS.
2 Судя по всему, ядра (шейдерные процессоры) RDNA 3 представляют собой удвоенную версию ядер RDNA 2.
В следующей таблице представлен прирост производительности новых видеокарт AMD по сравнению с предшественниками:
Radeon RX 7900 XTX | Radeon RX 7900 XT | |
В операциях с плавающей точкой | 2.6x | 2.3x |
Тексельная | +30% | +13% |
Пиксельная | +62% | +60% |
Пропускная способность памяти | +67% | +56% |
Как видим, номинальный прирост производительности и пропускной способности видеопамяти у новых видеокарт в целом получился значительным, за исключением тексельной скорости. Как результат, по последнему показателю Nvidia RTX 4090 превосходит AMD RX 7900 XTX на треть. А вот пиксельная производительность у RTX 4090 даже немного меньше (на 8%).
Сама AMD приводит следующие данные по производительности AMD RX 7900 XTX и её предшественника, которые в таблице дополнены результатами тестов, сделанных нашими коллегами из TechSpot (выделены синим шрифтом):
На нативном 4K разрешении
AMD RX 6950 XT | AMD RX 7900 XTX | Nvidia RTX 4090 | ||
Watch Dogs: Legion | 88 к/с | 1.5x = 132 к/с | 141 к/с | |
Cyberpunk 2077 | 49 к/с | 1.7x = 83 к/с | 83 к/с |
С трассировкой лучей, на разрешении 4K и при максимальных настройках
AMD RX 6950 XT | AMD RX 7900 XTX | Nvidia RTX 4090 | |
Dying Light 2 | 39 к/с 35 к/с | 72 к/с | 101 к/с |
Cyberpunk 2077 | 42 к/с 49 к/с | 62 к/с | 83 к/с |
Приведенные в последней таблице данные взяты из результатов, которые соответствуют значениям, названным AMD в отношении AMD RX 6950 XT. Непосредственно у TechSpot производительность этой карты в игре Cyberpunk 2077 с включенной трассировкой лучей и технологией масштабирования FSR составляет 27 к/с, а 49 к/с в таблице — это, напротив, с отключенной трассировкой лучей. Но если в качестве отправной точки взять значения из презентации AMD (заявленные для включенной трассировки лучей), то производительность Nvidia RTX 4090 по сравнению с AMD RX 7900 XTX оказывается выше на 34-40%. Зато в играх, где трассировка лучей отключена (согласно AMD, по умолчанию), у RX 7900 XTX получается примерно одинаковая производительность с RTX 4090. Реальная игровая производительность RX 7900 XTX наверняка окажется ниже, что вполне официально подтверждает сама AMD. В интервью PCWorld главный архитектор ПО подразделения Gaming Solutions компании, Фрэнк Азор (Frank Azor), сказал следующее:
[Radeon RX 7900 XTX] ($1 тыс) предназначен для соперничества с 4080 ($1.2 тыс), а у нас нет бенчмарков по 4080. Это основная причина, почему вы не увидели сравнения с Nvidia. … Видеокарта за 999 долларов — это не соперник 4090 ($1.6 тыс), который стоит на 60% дороже, это соперник 4080.
Первые результаты тестов новых видеокарт AMD следует ожидать 13 декабря, когда стартуют их продажи. В следующем году компания обещает выпустить 3-е поколение технологии апскейла FSR, которое до двух раз повысит производительность (количество к/с) по сравнению с FSR 2. Таким образом, FSR 3 станет ответом AMD на разработанную Nvidia технологию DLSS 3, значительно повысившую число кадров в секунду по сравнению с DLSS 2 (например, в Cyberpunk 2077 — на 43%). Кстати, в вышеупомянутом интервью Фрэнк Азор опровергнул мнение, что FSR 3 разработана в ответ на DLSS 3. По словам топ-менеджера AMD, в компании давно работают над FSR, при этом технология может работать на разных поколениях видеокарт AMD и даже на видеокартах других производителей (как уже рассказывал Gadgets News, DLSS 3 эксклюзивно поддерживается на видеокартах серии Nvidia RTX 40). А это, по словам Азора, «экспоненциально сложнее». Также AMD заявляет, что используемая в RX 7900 XTX и RX 7900 XT архитектура RDNA 3 по сравнению с RDNA 2 до 1.8 раз повысит производительность в играх с трассировкой лучей.
Если резюмировать эти очень предварительные и исходящие в основном от производителя данные, то в играх без использования трассировки лучей AMD RX 7900 XTX сулит производительность, сопоставимую по меньшей мере с Nvidia RTX 4080. В перспективе, с релизом FSR 3, в играх с трассировкой лучей возможно также будет достигнут относительный паритет с Nvidia. Главный козырь топовой видеокарты AMD — её цена: $1 тыс против $1.2 тыс за Nvidia RTX 4080.