PowerVR Series7XT и Series7XE: новые серии мобильных графических ускорителей

Сегодня компания Imagination Technologies анонсировала сразу две новые серии графических ускорителей: PowerVR Series7XT и PowerVR Series7XE. Первая является преемником Series 6XT, старшая модель которой (PowerVR GX6650) используется в самом производительном, пожалуй, с точки зрения графики, планшете iPad Air 2, а вторая — преемником Series 6XE, и соответственно предназначена для более бюджетных моделей. Главное отличие флагманской серии PowerVR Series7XT от предшественника заключается в значительном росте числа вычислительных блоков — со 192 в PowerVR GX6650 до 512 в PowerVR GT7900. Производительность новинок в максимальной конфигурации составляет 1 терафлопс (в режиме FP16) — практически десктопный уровень.

В целом конфигурация новых моделей выглядит следующим образом:

PowerVR Series7XT:
PowerVR GT7200: 2 шейдерных кластера, 64 ядра ALU FP32
PowerVR GT7400: 4 шейдерных кластера, 128 ядра ALU FP32
PowerVR GT7600: 6 шейдерных кластеров, 192 ядра ALU FP32
PowerVR GT7800: 8 шейдерных кластеров, 256 ядра ALU FP32
PowerVR GT7900: 16 шейдерных кластеров, 512 ядра ALU FP32

PowerVR Series7XE:
PowerVR GE7400: 1/2 шейдерных кластера, 16 ядер ALU FP32
PowerVR GE7800: 1 шейдерный кластер, 32 ядра ALU FP32

В свою очередь в таблице ниже представлены основные характеристики новых серий в сравнении с их предшественниками:

Series7XT Series7XE Series6XT Series6XE
Архитектура Rogue7 Rogue7 Rogue Rogue
Кол-во кластеров 2 — 16 0.5 — 1 2 — 8 0.5 — 1
FP32 флопс/такт 128 — 1024 32 — 64 128 — 512 32 — 64
FP16 флопс/такт 256 — 2048 64 — 128 256 — 1024 64 — 128
Пикселей/такт (ROP) 4 — 32? 1 — 2? 4 — 16 1 — 2
Текселей/такт 4 — 32 1 — 2 4 — 16 1 — 2
OpenGL ES 3.1 + + + +
Google AEP + + ? ?
OpenGL 4.4 +
Аппаратная тесселяция + Опционально Опционально
Direct3D Базовый: FL 10_0, опциональный: FL 11_1 FL 9_3 Базовый: FL 9_3, опциональный: FL 11_0 FL 9_3
OpenCL Базовый: 1.2 EB, опциональный: 1.2 FP 1.2 EB 1.2 EB 1.2 EB

Причем рост производительности обещает вырасти более высокими темпами, поскольку при одинаковой частоте и кластерной конфигурации в моделях новой серии она увеличилась на 30-60%.

Прежде чем перейти к описанию главных аппаратных отличий новой архитектуры, кратко опишем ее общее строение. Графический ускоритель PowerVR серии Series7XT состоит из шейдерных кластеров (от 2 до 16). Один шейдерный кластер состоит из 16 т.н. конвейеров (pipiline). В один конвейер входят: четыре ALU FP16, два ALU FP32, один ALU FP64 (опционально) и один SFU (точнее пара: SFU FP16 + SFU FP32).

ALU выполняет базовые вычислительные операции, а SFU — специализированные. FP16, FP32 и FP64 выражают степень точности, с которой в этих вычислительных блоках рассчитываются числа с плавающей точкой.

Итак, основные нововведения в новой архитектуре Rogue7:

1) Появление аппаратной поддержки тесселяции (способствующей лучшей детализации в компьютерной графике). Это особенно актуально для устройств, работающих под управлением Android 5.0 Lollipop — входящий в ее состав набор расширений для графического интерфейса OpenGL ES 3.1, Android Extension Pack (AEP), как раз включает поддержку этой функции.

2) Дополнение SFU аппаратной поддержкой операций FP16. В предыдущей серии эти операции выполнялись в SFU блоках с аппаратной поддержкой более точных FP32 вычислений, что приводило к неэффективному использованию более мощного и энергоемкого, чем требовалось, ресурса.

3) Вычисления в блоках SFU и ALU (либо FP16, либо FP32) могут выполняться одновременно, в то время как раньше это происходило поочередно.

4) Опциональная поддержка вычислительных блоков ALU FP64 (вы, наверное, успели заметить их в нашем описании новой архитектуры), что будет особенно востребовано в высокопроизводительных вычислениях, в том числе серверных. Да-да — несмотря на казалось бы мобильный сегмент графических ускорителей PowerVR, 16-кластерная модель PowerVR GT7900 позиционируется компанией Imagination Technologies не только для ноутбуков и игровых консолей, но и вычислительных серверов:

5) Т.н. «зоны безопасности», благодаря чему приложения будут работать с графикой более стабильно и изолированно от остальных компонентов операционной системы.

Примечательно, что с момента анонса предшествующей топовой линейки PowerVR в январе 2013 прошло менее года, в то время как еще несколько лет назад новые поколения графических ускорителей выходили через два-три года. Принимая во внимание, что анонсы PowerVR GX6650 и iPad Air 2 с этой моделью отделяют друг от друга около десяти месяцев, можно предположить, что процессор запланированного на осень 2015 планшета Apple получит одну из моделей новой флагманской серии — если не PowerVR GT7900, то PowerVR GT7800. А с учетом значительного отрыва (наравне с планшетами, оснащенными Nvidia Tegra K1) графической производительности iPad Air 2 от соперников (оснащенных моделями Qualcomm Adreno, ARM Mali и Samsung Exynos Octa) вполне вероятно, что интерес к топовым решениям Imagination Technologies проявят и другие производители смартфонов и планшетов.

С использованием данных Imagination Technologies (1), (2) и AnandTech