PowerVR Series7XT и Series7XE: новые серии мобильных графических ускорителей
Сегодня компания Imagination Technologies анонсировала сразу две новые серии графических ускорителей: PowerVR Series7XT и PowerVR Series7XE. Первая является преемником Series 6XT, старшая модель которой (PowerVR GX6650) используется в самом производительном, пожалуй, с точки зрения графики, планшете iPad Air 2, а вторая — преемником Series 6XE, и соответственно предназначена для более бюджетных моделей. Главное отличие флагманской серии PowerVR Series7XT от предшественника заключается в значительном росте числа вычислительных блоков — со 192 в PowerVR GX6650 до 512 в PowerVR GT7900. Производительность новинок в максимальной конфигурации составляет 1 терафлопс (в режиме FP16) — практически десктопный уровень.
В целом конфигурация новых моделей выглядит следующим образом:
PowerVR Series7XT:
PowerVR GT7200: 2 шейдерных кластера, 64 ядра ALU FP32
PowerVR GT7400: 4 шейдерных кластера, 128 ядра ALU FP32
PowerVR GT7600: 6 шейдерных кластеров, 192 ядра ALU FP32
PowerVR GT7800: 8 шейдерных кластеров, 256 ядра ALU FP32
PowerVR GT7900: 16 шейдерных кластеров, 512 ядра ALU FP32
PowerVR Series7XE:
PowerVR GE7400: 1/2 шейдерных кластера, 16 ядер ALU FP32
PowerVR GE7800: 1 шейдерный кластер, 32 ядра ALU FP32
В свою очередь в таблице ниже представлены основные характеристики новых серий в сравнении с их предшественниками:
Series7XT | Series7XE | Series6XT | Series6XE | |
Архитектура | Rogue7 | Rogue7 | Rogue | Rogue |
Кол-во кластеров | 2 — 16 | 0.5 — 1 | 2 — 8 | 0.5 — 1 |
FP32 флопс/такт | 128 — 1024 | 32 — 64 | 128 — 512 | 32 — 64 |
FP16 флопс/такт | 256 — 2048 | 64 — 128 | 256 — 1024 | 64 — 128 |
Пикселей/такт (ROP) | 4 — 32? | 1 — 2? | 4 — 16 | 1 — 2 |
Текселей/такт | 4 — 32 | 1 — 2 | 4 — 16 | 1 — 2 |
OpenGL ES 3.1 | + | + | + | + |
Google AEP | + | + | ? | ? |
OpenGL 4.4 | + | — | — | — |
Аппаратная тесселяция | + | Опционально | Опционально | — |
Direct3D | Базовый: FL 10_0, опциональный: FL 11_1 | FL 9_3 | Базовый: FL 9_3, опциональный: FL 11_0 | FL 9_3 |
OpenCL | Базовый: 1.2 EB, опциональный: 1.2 FP | 1.2 EB | 1.2 EB | 1.2 EB |
Причем рост производительности обещает вырасти более высокими темпами, поскольку при одинаковой частоте и кластерной конфигурации в моделях новой серии она увеличилась на 30-60%.
Прежде чем перейти к описанию главных аппаратных отличий новой архитектуры, кратко опишем ее общее строение. Графический ускоритель PowerVR серии Series7XT состоит из шейдерных кластеров (от 2 до 16). Один шейдерный кластер состоит из 16 т.н. конвейеров (pipiline). В один конвейер входят: четыре ALU FP16, два ALU FP32, один ALU FP64 (опционально) и один SFU (точнее пара: SFU FP16 + SFU FP32).
ALU выполняет базовые вычислительные операции, а SFU — специализированные. FP16, FP32 и FP64 выражают степень точности, с которой в этих вычислительных блоках рассчитываются числа с плавающей точкой.
Итак, основные нововведения в новой архитектуре Rogue7:
1) Появление аппаратной поддержки тесселяции (способствующей лучшей детализации в компьютерной графике). Это особенно актуально для устройств, работающих под управлением Android 5.0 Lollipop — входящий в ее состав набор расширений для графического интерфейса OpenGL ES 3.1, Android Extension Pack (AEP), как раз включает поддержку этой функции.
2) Дополнение SFU аппаратной поддержкой операций FP16. В предыдущей серии эти операции выполнялись в SFU блоках с аппаратной поддержкой более точных FP32 вычислений, что приводило к неэффективному использованию более мощного и энергоемкого, чем требовалось, ресурса.
3) Вычисления в блоках SFU и ALU (либо FP16, либо FP32) могут выполняться одновременно, в то время как раньше это происходило поочередно.
4) Опциональная поддержка вычислительных блоков ALU FP64 (вы, наверное, успели заметить их в нашем описании новой архитектуры), что будет особенно востребовано в высокопроизводительных вычислениях, в том числе серверных. Да-да — несмотря на казалось бы мобильный сегмент графических ускорителей PowerVR, 16-кластерная модель PowerVR GT7900 позиционируется компанией Imagination Technologies не только для ноутбуков и игровых консолей, но и вычислительных серверов:
5) Т.н. «зоны безопасности», благодаря чему приложения будут работать с графикой более стабильно и изолированно от остальных компонентов операционной системы.
Примечательно, что с момента анонса предшествующей топовой линейки PowerVR в январе 2013 прошло менее года, в то время как еще несколько лет назад новые поколения графических ускорителей выходили через два-три года. Принимая во внимание, что анонсы PowerVR GX6650 и iPad Air 2 с этой моделью отделяют друг от друга около десяти месяцев, можно предположить, что процессор запланированного на осень 2015 планшета Apple получит одну из моделей новой флагманской серии — если не PowerVR GT7900, то PowerVR GT7800. А с учетом значительного отрыва (наравне с планшетами, оснащенными Nvidia Tegra K1) графической производительности iPad Air 2 от соперников (оснащенных моделями Qualcomm Adreno, ARM Mali и Samsung Exynos Octa) вполне вероятно, что интерес к топовым решениям Imagination Technologies проявят и другие производители смартфонов и планшетов.
С использованием данных Imagination Technologies (1), (2) и AnandTech