Обзор Nvidia GeForce GTX 980

Предлагаем вашему вниманию обещанный обзор нового графического ускорителя GeForce GTX 980, который вместе с GeForce GTX 970 на днях был анонсирован компанией Nvidia. Обе модели основаны на новейшей архитектуре Maxwell, а точнее ее втором поколении, GM204 — впервые в истории графических ускорителей Nvidia. GeForce GTX 980 позиционируется в качестве преемника GTX 780/780Ti, а GeForce GTX 970, соответственно — GTX 770.

Благодаря Maxwell новинки отличает не столько высокая производительность (по части которой GeForce GTX 980 опережает своего предшественника, GeForce GTX 780 Ti, в среднем на 10%, а модель конкурирующей AMD, Radeon R9 290X, на 10-20%), сколько очень низкое энергопотребление. Если у GeForce GTX 780 Ti и GeForce GTX 780 оно составляет 250 Вт, то у GeForce GTX 980 и GeForce GTX 970 — 165 Вт и 145 Вт соответственно, т.е. в 1.5-1.7 меньше. В результате по сравнению с GTX 780 и GTX 680 (архитектура Kepler) эффективность GTX 980 (архитектура Maxwell) выросла в два раза — с 15 гига-FLOPS на один ватт до 30 гига-FLOPS/Вт.

Подобного эффекта Nvidia добилась в том числе за счет следующих ухищрений:

  • снижения количества ядер CUDA в блоке SMX со 192 до 128, с сохранением при этом 90% прежней производительности;
  • значительного увеличения объема кеш-памяти L2, используемой в каждом наборов ROP (пиксельных сопроцессоров), до 2 Мб (до сих ее максмальное значение составляло 512 Кб);
  • дополнительной оптимизации на уровне транзисторов.

И это при том, что топология, не меняющаяся почти три года, осталась прежней — 28 нанометров. Такому достижению способствовали разработки Nvidia в области мобильных графических ускорителей — энергопотребление ее Tegra K1 составляет всего 5 Вт — в 20 раз меньше, чем у настольных игровых приставок PlayStation 3 и Xbox 360, сопоставимых с Tegra K1 по производительности.

Рост эффективности коснулся и ядер — согласно Nvidia, в архитектуре Maxwell GM204 по сравнению с Kepler GK110 она выросла на 40%, благодаря чему 2048-ядерный GeForce GTX 980 превосходит по производительности 2880-ядерный GTX 780 Ti.

Структура GeForce GTX 980 выглядит следующим образом: он состоит из 4 GPC (Graphics Processing Cluster — кластеров графической обработки), каждый из которых содержит по 4 SMM (Streaming Multiprocessor Maxwell — потоковых мультипроцессоров Maxwell). В свою очередь каждый SMM включает 16 TMU (текстурных блоков), 128 ядер CUDA, кеш-память L1 и общую (в российской версии сайта Nvidia она называется разделяемой) с TMU память объемом в 96 Кб (в поколении GM107 она составляла 64 Кб).

На каждый SMM приходится один набор из 16 ROP (пиксельных сопроцессоров, обрабатывающих 8 пикселей за одну тактовую частоту) с одним 64-разрядным контроллером памяти. Таким образом, соотношение между ROP и контроллером памяти во 2-ом поколении Maxwell, GM204, выросло в 2 раза и составило 16:1 — в первом поколении, GM107, оно оставалось неизменным со времен Kepler и даже Fermi, и составляло 8:1. Однако «бутылочным горлышком» новой архитектуры это, будем надеяться, не станет — возросшая нагрузка на контроллер памяти компенсируется снижением объема трафика за счет применения новой, 3-го поколения, технологии т.н. цветного сжатия.

Хотя информация об этих и многих других моделях графических ускорителей вместе с результатами тестов производительности собрана нами в отдельной большой таблице, предлагаем вашему вниманию сравнительные характеристики новинок в более сжатом виде:

GTX 980 GTX 970 GTX 780 Ti GTX 780 GTX 770
Цена $549 $329 $699 $649 $399
Дата релиза 18.09.2014 18.09.2014 11.07.2013 23.05.2013 30.05.2013
Архитектура Maxwell Maxwell Kepler Kepler Kepler
GPU GM204 GM204 GK110 GK110 GK104
Количество транзисторов 5.2 млрд 5.2 млрд 7.1 млрд 7.1 млрд 3.5 млрд
Количество ядер FP32 2048 1664 2880 2304 1536
Общее количество TMU (текстурных блоков) 128 104 240 192 128
Общее количество ROP (пиксельных сопроцессоров) 64 64 48 48 32
Кеш L2 (в одном наборе ROP) 2 Мб 2 Мб 256 Кб 256 Кб 512 Кб
Crysis 3 (2160×3840, Low Quality, FXAA) 49 47.4 39.4 36.6
Battlefield 4 (1440×2560, Ultra Quality) 58.2 53.7 44.5 37.4

Другой особенностью GeForce GTX 980 и GeForce GTX 970 стала поддержка нескольких новых технологий — в частности, консервативного сглаживания, MFAA, DSR и VXGI.

Смысл консервативного сглаживания состоит в том, что при наложении полигона (треугольника, из множества которых создается трехмерное изображение) на пиксель, он заполняется цветом этого полигона не только тогда, когда полигоном покрыта его большая часть, но даже небольшая. В результате, насколько мы поняли, прорисовываются даже самые мелкие детали, чего не происходило при обычной растеризации.

MFAA (Multi-Frame Sampled Anti-Aliasing), представляет собой т.н. многокадровое сглаживание «зазубренных» краев изображения на экране.

Как поясняет производитель, «MFAA производит сложную выборку пикселей как в одном кадре, так и сразу в нескольких кадрах. После этого она использует специально разработанный синтезирующий фильтр для создания изображений лучшего качества со скоростью, намного превышающей традиционное сглаживание. Для геймеров MFAA означает качество изображения на уровне 4xMSAA, при потерях производительности, как при использовании 2xMSAA. Игры идут быстрее при меньшей нагрузке на GPU«.

Дополнительную реалистичность компьютерной графике на новых моделях графических ускорителей обещает придать технология VXGI (Voxel Global Illumination). Ее главным достоинством является использование не только прямого, но и непрямого освещения — рассеянного света, зеркального отражения и т.д. Воксельное глобальное освещение уже интегрировано в такие популярные игровые движки как Unreal Engine 4 и будет доступно разработчикам позднее в этом году.

DSR (Dynamic Super Resolution), или технология динамического суперразрешения, подразумевает рендеринг графики в высоком разрешении (например, 4K), после чего при помощи т.н. фильтра Гаусса оно масштабируется в нативное (родное) разрешение вашего дисплея. Полученное изображение имеет более высокое качество, чем при выполнении рендеринга непосредственно в Full HD (даже если это разрешение вашего дисплея), хотя и приводит к дополнительной нагрузке и снижению частоты кадров с секунду в компьютерных играх. Поэтому при желании эту опцию можно отключить.

Благодаря поддержке HDMI 2.0, графические ускорители с архитектурой Maxwell GM204 в большей степени адаптированы к использованию мониторов с разрешением 4K и частотой 60 Гц, причем в отличие от моделей с архитектурой Kepler таких мониторов можно подключить не два, а четыре.

Еще одним достоинством новых графических ускорителей, которое следует упомянуть, является технология VR Direct, предназначенная для вывода информации не на монитор, а очки виртуальной реальности (такие как Oculus Rift). Согласно Nvidia, она несет следующие преимущества:

  • Конфигурация VR SLI, которая обеспечивает более высокую производительность на устройствах виртуальной реальности, в рамках которой несколько GPU обсчитывают стереоизображение намного быстрее.
  • Функция Asynchronous Warp, которая сокращает задержки изображения и быстро подстраивает картинку в соответствии с поворотом головы геймеров, устраняя необходимость заново обсчитывать новые кадры.
  • Функция Auto Stereo, которая повышает совместимость игр с устройствами виртуальной реальности и позволяет пользователям играть на гарнитурах, которые изначально не были предназначены для использования в виртуальной реальности.

Что касается фактических результатов тестирования на играх, то подробно с ними мы рекомендуем ознакомиться в нашей Таблице графических ускорителей для ПК. Для общего же представления предлагаем вашему вниманию результаты тестирования на двух играх: Crysis 3 и Battlefield 4. Игры запускались на компьютере с процессором Intel Core i7-4960X 4.2 ГГц (с подробными характеристиками которого можно ознакомится в Таблице процессоров Intel Core), 8 Гб оперативной памяти и монитором Asus PQ321. На компьютере под управлением Windows 8.1 Pro были установлены драйверы Nvidia Release 344.07 Beta и AMD Catalyst 14.300.1005 Beta.

Любопытно, но одна самых требовательных к графическим мощностям игр, Crysis 3, стала единственной, в которой GeForce GTX 980 идет вровень с GTX 780 Ti — в остальных играх (включая Battlefield 4) новичок демонстрирует над этой моделью явное превосходство:

Средний игровой результат закрепляет лидерство GeForce GTX 980:

В США GeForce GTX 980 и GeForce GTX 970 будут стоить от $549 (21.2 тыс. руб.) и $329 (12.7 тыс. руб.), в России — от 24 тыс. руб. и 15 тыс. руб., в Украине — от 8 тыс. гривен (22.9 тыс. руб.) и 5 тыс. гривен (14.3 тыс. руб.)

С использование данных Nvidia и AnandTech