Apple A13 Bionic: архитектура и производительность

На днях наши коллеги из AnandTech опубликовали обстоятельный обзор трех новых смартфонов Apple, iPhone 11, iPhone 11 Pro, iPhone 11 Pro Max. Две старшие модели получили улучшенный дисплей (контрастность выросла с 1000000:1 до 2000000:1, яркость — с 625 до 800 нитов), 4-5 дополнительных часов автономной работы и конечно же новую камеру. Последняя от предшественника отличается, в частности, 2-кратным оптическим зумом на уменьшение (в дополнение к имевшемуся у iPhone XS 2-кратному оптическому зуму на увеличение) и технологией ночной съемки Deep Fusion, являющейся аналогом анонсированной год назад Google Night Sight.

Но главный интерес для Gadgets News традиционно представляет новый процессор. Напомню, что по сравнению с A12 Bionic у A13 Bionic количество транзисторов выросло с 6.9 млрд до 8.5 млрд (+23%), а производительность ЦПУ и ГПУ, по данным самой Apple — на 20%. Насколько последняя цифра соответствует действительности нам помогут разобраться результаты тестов, проведенных AnandTech.

Но сначала коснемся архитектурных изменений. Как и у двух его предшественников, ЦПУ в новом процессоре представлен связкой двух производительных ядер и четырех энергоэффективных:

A13 BionicA12 BionicA11 Bionic
ТехпроцессTSMC 7 нмTSMC 7 нмTSMC 10 нм
Площадь кристалла98.48 мм283.27 мм287.66 мм2
Кол-во транзисторов8.5 млрд6.9 млрд4.3 млрд
ЦПУ2 × Lightning (2.66 ГГц)
4 × Thunder (1.73 ГГц)
2 × Vortex (2.50 ГГц)
4 × Tempest (1.59 МГц)
2 × Monsoon (2.38 МГц)
4 × Mistral (1.59 МГц)

Ниже приводятся основные архитектурные отличия ЦПУ A13 Bionic от его прошлогоднего предшественника. Производительные ядра (Lightning):

A13 BionicA12 Bionic
Кэш L1
(задержка)
128 Кб + 128 Кб
(3 цикла)
128 Кб + 128 Кб
(3 цикла)
Кэш L2
(задержка)
8 Мб
(14 циклов)
8 Мб
(16 циклов)
Продолжительность целочисленного умножения3 цикла4 цикла
Кол-во ALU, устанавливающих флаги состояния32

К этому можно добавить интеграцию с ядрами Lightning «акселераторов машинного обучения» (вероятно, блоков матричного перемножения), которые по сравнению с применяемыми в ядрах Vortex векторными конвейерами обеспечивают 6-кратный рост производительности в соответствующих задачах (до 1 TOPS).

Энергоэффективные ядра (Thunder):

A13 BionicA12 Bionic
Кэш L148 Кб + ?32 Кб + ?
Буфер ассоциативной трансляции кэша L1128 страниц (2 Мб)128 страниц (2 Мб)
Кэш L2
(доступно)
3 Мб
(2.5 Мб)
2 Мб
(1.5 Мб)
Буфер ассоциативной трансляции кэша L21024 страниц (8 Мб)512 страниц (4 Мб)
Продолжительность сложения чисел с плавающей точкой3 цикла4 цикла
Продолжительность деления чисел с плавающей точкой (одинарной точности)9 циклов12 циклов
Продолжительность деления чисел с плавающей точкой (двойной точности)10 циклов19 циклов
Кол-во ALU, устанавливающих флаги состояния21
Время задержки при доступе к DRAM340 нс140-150 нс

Как видим, микроархитектура производительных ядер не претерпела существенных изменений — чего нельзя сказать про энергоэффективные. Правда, кое в чем у последних наблюдается регресс — задержка при доступе к оперативной памяти выросла более чем вдвое. Это связано с изменением политики DVFS (динамического изменения напряжения и частоты), которые отныне не позволяют младшим ядрам увеличивать частоты контроллера памяти. По этой причине в некоторых тестах производительность A13 Bionic оказалась даже ниже, чем у A12 Bionic.

Теперь обратимся к результатам тестирования производительности. Вот как они выглядят в синтетическом бенчмарке SPEC2006. Напомню, что слева показаны мощность (т.е. скорость энергопотребления) — например, 4.61 Вт (Дж/сек), а также общее энергопотребление за время теста — например, 11135 Дж (Вт⋅с), т.е. 3 Вт⋅ч. В свою очередь справа — общая производительность (например, 52.82 баллов). Как видим, при энергопотреблении процессора в 3 Вт⋅ч, производительное ядро A13 Bionic (Lightning) показывает производительность почти вдвое выше, чем у «толстых» ядер его соперников.

Но что самое примечательное, по уровню быстродействия в этом тесте ядро процессора для смартфонов занимает промежуточное положение (52.82 баллов) между ядрами самых топовых десктопных процессоров, AMD Ryzen 3900X (49.02) и Intel Core 9900K (54.28). Эти цифры вполне соответствуют результатам другого, гораздо более популярного теста, Geekbench 5 (по данным его официального сайта):

ПроцессорКонфигурацияПроизводительность одноядернаяПроизводительность многоядерная
Intel Core i9-9900K, 95 Вт8 ядер, 3.6 ГГц1,3418,720 (70%)
Apple A13 Bionic2+4 ядер, 2.66 ГГц1,329 (99%)3,419 (28%)
AMD Ryzen 3900X, 105 Вт12 ядер, 3.8 ГГц1,287 (96%)12,390
Apple A12X Bionic4+4 ядер, 2.5 ГГц1,114 (83%)4,614 (37%)
Apple A12 Bionic2+4 ядер, 2.5 ГГц1,109 (83%)2,632 (21%)
Intel Core i7-4770K, 84 Вт (2013)4 ядра, 3.5 ГГц986 (74%)3,734 (30%)
Apple A11 Bionic2+4 ядер, 2.3 ГГц922 (69%)2,310 (19%)
Samsung Exynos 98202+2+4 ядер, 2.0 ГГц760 (57%)2,137 (17%)
Qualcomm Snapdragon 8554+4 ядер, 1.8 ГГц725 (54%)2,664 (22%)
Huawei HiSilicon Kirin 9802+2+4 ядер, 1.8 ГГц676 (50%)2,297 (19%)
Apple A7 (2013)2 ядра, 1.3 ГГц259 (19%)474 (4%)

Итак, что мы видим помимо того, что в одноядерной скорости процессор iPhone 11 занял промежуточное место между двумя современными топовыми процессорами для ПК и почти вдвое опередил своих мобильных конкурентов? То, что собственно и стало причиной уравнения ядра A13 Bionic с ядрами Core i9-9900K и Ryzen 3900X — опережающий, по сравнению с десктопными процессорами Intel и AMD, рост производительности мобильных чипов Apple. Если с 2013 года одноядерная производительность процессоров Intel выпосла c 986 до 1341 баллов, т.е. на 36%, то у процессоров Apple она взлетела с 259 до 1329 баллов, т.е. в 5 раз.

Одной из главных причин этой разницы в росте производительности мобильных и десктопных процессоров является разная динамика техпроцессов. В случае с Intel мы имеем переход с 22 нм на 14 нм, а в случае с Apple — переход от Samsung 28 нм к TSMC 7 нм (2-е поколение). Плотность размещения транзисторов в этих техпроцессах выглядит следующим образом:

ГодТехпроцессПроцессорКол-во транзисторов на 1 мм2
2020Intel 10 нм100.8 млн
2018Intel 14 нмIntel Core i9-9900K37.5 млн
2013Intel 22 нмIntel Core i7-4770K15.3 млн
2020TSMC 5 нмApple A14124 млн
2019TSMC 7 нм (2-е поколение)Apple A13 Bionic86.3 млн 1
2013Samsung 28 нмApple A79.8 млн 2

1 из расчета 98.48 мм2 и 8.5 млрд транзисторов

2 из расчета 102 мм2 и 1 млрд транзисторов (по данным Википедии)

Таким образом, у мобильных чипов плотность размещения транзисторов с 2013 года выросла в 8.8 раз, а у десктопных процессоров Intel — в 2.5 раза. Ну и конечно не будем забывать об опережающей, за счет архитектуры и лучшей интеграции с собственным программным обеспечением, производительности процессоров самой Apple — по сравнению с конкурентами она вдвое выше.

В сухом остатке мы имеем топовый мобильный процессор на базе архитектуры ARM, который в одноядерной производительности сравнялся с топовыми десктопными x86-процессорами, чьи энергопотребление и цена в несколько раз выше. В этом смысле, пафосно выражаясь, мы переживаем исторический момент.

В то же время ядерная гонка на десктопных процессорах сказывается больше. Архитектура big.LITTLE мобильных чипов подразумевает, что основная нагрузка ложится на big-ядра — а их количество (2 шт) в процессорах Apple с 2013 года осталось неизменным. У десктопных процессоров деления на производительные и энергоэффективные ядра нет. Поэтому увеличение общего количества ядер привел к тому, что общая, многоядерная, производительность у топового процессора Intel за последние 5-6 лет выросла с 3734 до 8720, т.е. в 2.3 раза (одноядерная, напоминаю, только на 36%). У мобильного процессора Apple она выросла еще больше, с 474 до 3419, т.е. в 7.2 раз, но в любом случае это только 39% от десктопной производительности (если сравнивать с 12-ядерным AMD Ryzen 3900X — 28%). А в следующем году ожидается релиз десктопных процессоров Intel на базе 10-нм техпроцесса, где плотность размещения транзисторов увеличится в 2.7 раз — тогда как у Apple A14, по данным IBS Research, только на 44%.

Однако SPEC2006 с Geekbench 5 — далеко не единственные тесты. Предлагаю вашему вниманию результаты тестирования A13 Bionic в других бенчмарках. Начнем с браузерной производительности:

iPhone 11
(A13 Bionic)
iPhone XS
(A12 Bionic)
iPhone X
(A11 Bionic)
Asus ROG Phone II
(Snapdragon 855 Plus)
Galaxy S10+
(Exynos 9820)
Huawei P30 Pro
(Kirin 980)
Speedometer 2.0159132 (83%)97.5 (61%)71.5 (45%)59.1 (37%)68 (43%)
JetStream 2129.15114.51 (89%)98.67 (76%)?48.34 (37%)62.27 (48%)
WebXPRT 3188153 (81%)143 (76%)100 (53%)97 (52%)111 (59%)

Устойчивая (после троттлинга) графическая производительность:

iPhone 11 / Pro
(A13 Bionic)
iPhone XS
(A12 Bionic)
iPhone X
(A11 Bionic)
Asus ROG Phone II
(Snapdragon 855 Plus)
Galaxy S10+
(Exynos 9820)
Huawei P30 / Pro
(Kirin 980)
3DMark Sling Shot Extreme (ES 3.1) — Физика2,333
(53%)
2,910
(66%)
1,881
(43%)
3,597
(82%)
3,582
(81%)
4,396
3DMark Sling Shot Extreme (ES 3.1) — Графика4,495 / 5,904
(57% / 75%)
3,929
(50%)
2,884 (37%)7,8703,150
(40%)
4,352 / 3,208
(55% / 41%)
GFXBench Aztec Ruins — High (off-screen)19.54 / 22.56
(87% / -)
15.02
(67%)
9.3
(41%)
19.7
(87%)
13.73
(61%)
12.46
(55%)

Здесь прежде всего надо сделать оговорку, что из протестированных AnandTech смартфонов с процессором Snapdragon 855 в эту таблицу отобран самый производительный, Asus ROG Phone II (Snapdragon 855 Plus, 12 Гб и воздушное охлаждение). Отсюда результат, сопоставимый с iPhone 11, в бенчмарке GFXBench Aztec Ruins — High (off-screen) — 19.7 к/с VS 19.54 к/с. Для сравнения, оснащенная Snapdragon 855 американо-китайская версия Galaxy S10+ в том же тесте набирает скромные 11.06 к/с.

Также особого внимания заслуживает 30% увеличение устойчивой производительности iPhone 11 по сравнению с его прошлогодним предшественником (при том, что заявленный Apple номинальный прирост скорости — 20%). Речь идет о вышеупомянутом бенчмарке GFXBench Aztec Ruins — High (off-screen), в котором процессоры Apple традиционно лидируют. При этом температура корпуса не нагревается выше 41°C (мощность смартфона при этом колеблется от 4 Вт до 6 Вт). AnandTech пишет, что некоторые Android-смартфоны нагревались сильнее, но конкретных моделей и цифр не называет.

А вот в 3DMark Sling Shot Extreme (ES 3.1) наблюдается двойная странность:

  • В тесте Физика (в котором основная нагрузка ложится на ЦПУ) новый процессор Apple оказался заметно хуже своего предшественника — 2333 VS 2910 (+25%). Можно предположить, что это связано с двойным увеличением времени задержки у A13, по сравнению с A12, при доступе к DRAM.
  • В тесте Графика (основная нагрузка — на ГПУ) Pro-версия iPhone 11 существенно быстрее стандартной версии: 5904 (+31%) VS 4495. Результаты Huawei P30 и P30 Pro еще более странные: 4352 (+36%) VS 3208 (т.е. Pro-версия медленнее стандартной).

А вот до топовых видеокарт ГПУ процессоров Apple еще очень далеко. По данным чарта на сайте GFXBench, в тесте Aztec Ruins — High (off-screen) король графических ускорителей Titan RTX набирает 366 к/с. И даже самая бюджетная модель в линейке современных видеокарт Nvidia, RTX 2060 (DirectX), производительнее A13 Bionic в 8 раз (179 к/с).

Тем не менее, на примере мобильной консоли Nintendo Switch можно видеть, что даже очень требовательные игры (Doom, Outlast 2, Wolfenstein II, или вышедший на днях Ведьмак 3) возможно вполне качественно портировать с десктопных приставок последнего поколения на устройство с мобильным процессором, который был анонсирован почти 5 лет назад. В тесте Aztec Ruins — High (off-screen) приставка Nvidia Shield TV c этим процессором показывает 13.5 к/с. Очевидно, что устойчивая производительность портативной версии Nintendo Switch еще ниже, поэтому в этом графическом тесте A13 Bionic как минимум вдвое производительнее Tegra X1. Если принять во внимание включенную в iOS 13 поддержку игровых контроллеров PlayStation 4 и Xbox One S, у iPhone с iPad имеется большой потенциал в качестве игровой платформы.

В заключение остается напомнить, что согласно таким авторитетным источникам как Bloomberg и Минг-Чи Куо, в 2020-2021 году Apple начнет оснащать своими процессорами не только смартфоны с планшетами, но и ноутбуки с десктопными компьютерами. И как мы видим, с точки зрения быстродействия ЦПУ предпосылки для этого уже имеются.