IMG AXT-64-2048: мобильное ГПУ с десктопной производительностью
Сегодня Imagination Technologies представила 10-е поколение PowerVR, серию IMG A. Как утверждает глава компании, это самый важный её анонс за последние 15 лет, с тех пор как летом 2005 она анонсировала семейство мобильных ГПУ PowerVR SGX. Старшим в нем был PowerVR SGX530, чья производительность в операциях с плавающей точкой составляла 1.6 гига-флопс, а скорость заполнения — 200 мега-пикселей в секунду (при частоте 200 МГц, на кристалле с 65-нм техпроцессом).
А вот как спустя 15 лет выглядит серия мобильный ГПУ IMG A:
Операции с плавающей точкой (FP32) | Скорость заполнения | Машинное обучение | |
IMG AXT-64-2048 | 2.0 тера-флопс | 64 гига-пикселей/с | 8 трлн операций |
IMG AXT-48-1536 | 1.5 тера-флопс | 48 гига-пикселей/с | 6 трлн операций |
IMG AXT-32-1024 | 1.0 тера-флопс | 32 гига-пикселей/с | 4 трлн операций |
IMG AXT-16-512 | 0.5 тера-флопс | 16 гига-пикселей/с | 2 трлн операций |
IMG AXM-8-256 | 0.25 тера-флопс | 8 гига-пикселей/с | 1 трлн операций |
IMG AXE-2-16 | 16 гига-флопс | 2 гига-пикселей/с | |
IMG AXE-1-16 | 16 гига-флопс | 1 гига-пиксель/с |
Таким образом, по сравнению с топовым ГПУ PowerVR 2005 года у IMG AXT-64-2048 производительность в операциях с плавающей точкой выросла в 1250 раз, скорость заполнения пикселей — в 320 раз. В свою очередь по сравнению с нынешними устройствами на рынке с PowerVR графическая производительность выросла в 2.5 раза, скорость машинного обучения — в 8 раз, а энергопотребление снизилось на 60% (на одинаковых техпроцессе и тактовой частоте).
Но пожалуй еще интереснее сравнить новейшее топовое ГПУ для мобильных устройств с самой топовой из десктопных игровых приставок, Xbox One X (2016). У последней скорость вычислений в операциях с плавающей точкой и заполнении пикселей составляет соответственно 6 тера-флопс и 37.5 гига-пикселей/с. По первому показателю разница 3-кратная, но едва ли это критично принимая во внимание Xbox One и PlayStation 4 (2013) — у тех 1.31 и 1.84 тера-флопс. При этом скорость заполнения у IMG AXT-64-2048 аж вдвое превышает таковую у Xbox One X (64 vs 37.5 гига-пикселей/с). Таким образом, можно уверенно утверждать, что топовое мобильное ГПУ PowerVR сравнялось с графическими ускорителями для десктопных игровых консолей последнего поколения. Правда справедливости ради надо заметить, что через год состоится релиз игровой приставки, которая будет в 4 раза производительнее Xbox One X.
Десктопная производительность IMG AXT-64-2048 объясняется основательной переработкой архитектуры. В первую очередь это касается ширины SIMD — по сравнению с предыдущими поколениями она выросла с 16 и 32 до 128 регистров на одно ALU (арифметико-логическое устройство). Для сравнения, в Mali-G77 ширина SIMD составляет 16 регистров. Одновременно с одного до двух увеличилось число текстурных блоков (чья микроархитектура также изменилась), что соответствующим образом сказалось на текстурной производительности.
От мобильных ГПУ компании ARM новая микроархитектура IT отличается гораздо более крупными вычислительными блоками. Одно ядро AXT эквивалентно восьми ядрам Mali-G77 в операциях с плавающей точкой и четырем — в заполнении пикселей.
Еще один жирный плюс новой микроархитектуры — технология HyperLane, суть которой состоит в реализации многозадачности на уровне ГПУ. В отличие от традиционных ГПУ (где по отдельности выполняется работа геометрического, пиксельного, шейдерного или какого-то другого блока — пока остальные простаивают в ожидании своей очереди), HyperLane позволяет одновременно нагружать все блоки. Количество одновременно выполняемых действий ограничено восемью, под каждое выделяется отдельная виртуальная память.
Возвращаясь к соперникам, Imagination Technologies сравнивает между собой Adreno 640 и Mali-G77 MP12 (12-кластерный): при одинаковой производительности площадь второго на 85% больше. В свою очередь ГПУ с новейшей архитектурой IT при одинаковой с ними производительности по сравнению с Mali-G77 MP12 занимает «намного меньше» площади и потребляет «намного меньше» энергии, а при почти одинаковой (немного меньше) с Mali-G77 MP12 площади имеет на 75% более высокую производительность.
Компания также поделилась дорожной картой своих ГПУ до 2022 года включительно. Новые серии будут называться по буквам латинского алфавита и прибавлять по 30% быстродействия каждый год, причем уже в следующем появится [аппаратная] поддержка трассировки лучей.
Несмотря на внушительные характеристики, будущее применение мобильных графических ускорителей PowerVR под вопросом. Qualcomm и Apple используют собственные ГПУ (причем, как вы наверное помните, до этого Apple пользовалась услугами Imagination Technologies), а Samsung заключила в этом году стратегическое партнерство с AMD. По мнению наших коллег из AnandTech, Huawei едва ли откажется от сотрудничества с ARM, зато неплохим кандидатом на роль заказчика Imagination Technologies является MediaTek. Как уже рассказывал Gadgets News, последняя на днях представила мобильный процессор для топовых 5G-смартфонов 2020 года. В качестве ГПУ Dimensity 1000 использует Mali-G77 MP9, но в будущем компания могла бы попытаться заявить о себе процессором для смартфонов с десктопным уровнем производительности. Не будем исключать и вероятности поглощения Imagination Technologies со стороны Apple — если та сочтет невозможным самостоятельно разработать эквивалентный по производительности ГПУ.
И конечно Imagination Technologies может заинтересовать автопром — по мере распространения систем беспилотного управления автомобилем будет расти спрос и на мобильное железо, которое потянет такие большие нагрузки. Бортовой компьютер Tesla, напомню, имеет производительность 144 TOPS (трлн операций в секунду) при 72 Вт энергопотребления. До такого уровня IMG AXT-64-2048 (8 TOPS) очень далеко, но при умеренном энергопотреблении (в пределах 10 Вт) процессоры с этим ГПУ некоторых разработчиков автопилота заинтересовать способны.