Apple A13 Bionic: архитектура и производительность
На днях наши коллеги из AnandTech опубликовали обстоятельный обзор трех новых смартфонов Apple, iPhone 11, iPhone 11 Pro, iPhone 11 Pro Max. Две старшие модели получили улучшенный дисплей (контрастность выросла с 1000000:1 до 2000000:1, яркость — с 625 до 800 нитов), 4-5 дополнительных часов автономной работы и конечно же новую камеру. Последняя от предшественника отличается, в частности, 2-кратным оптическим зумом на уменьшение (в дополнение к имевшемуся у iPhone XS 2-кратному оптическому зуму на увеличение) и технологией ночной съемки Deep Fusion, являющейся аналогом анонсированной год назад Google Night Sight.
Но главный интерес для Gadgets News традиционно представляет новый процессор. Напомню, что по сравнению с A12 Bionic у A13 Bionic количество транзисторов выросло с 6.9 млрд до 8.5 млрд (+23%), а производительность ЦПУ и ГПУ, по данным самой Apple — на 20%. Насколько последняя цифра соответствует действительности нам помогут разобраться результаты тестов, проведенных AnandTech.
Но сначала коснемся архитектурных изменений. Как и у двух его предшественников, ЦПУ в новом процессоре представлен связкой двух производительных ядер и четырех энергоэффективных:
A13 Bionic | A12 Bionic | A11 Bionic | |
Техпроцесс | TSMC 7 нм | TSMC 7 нм | TSMC 10 нм |
Площадь кристалла | 98.48 мм2 | 83.27 мм2 | 87.66 мм2 |
Кол-во транзисторов | 8.5 млрд | 6.9 млрд | 4.3 млрд |
ЦПУ | 2 × Lightning (2.66 ГГц) 4 × Thunder (1.73 ГГц) | 2 × Vortex (2.50 ГГц) 4 × Tempest (1.59 МГц) | 2 × Monsoon (2.38 МГц) 4 × Mistral (1.59 МГц) |
Ниже приводятся основные архитектурные отличия ЦПУ A13 Bionic от его прошлогоднего предшественника. Производительные ядра (Lightning):
A13 Bionic | A12 Bionic | |
Кэш L1 (задержка) | 128 Кб + 128 Кб (3 цикла) | 128 Кб + 128 Кб (3 цикла) |
Кэш L2 (задержка) | 8 Мб (14 циклов) | 8 Мб (16 циклов) |
Продолжительность целочисленного умножения | 3 цикла | 4 цикла |
Кол-во ALU, устанавливающих флаги состояния | 3 | 2 |
К этому можно добавить интеграцию с ядрами Lightning «акселераторов машинного обучения» (вероятно, блоков матричного перемножения), которые по сравнению с применяемыми в ядрах Vortex векторными конвейерами обеспечивают 6-кратный рост производительности в соответствующих задачах (до 1 TOPS).
Энергоэффективные ядра (Thunder):
A13 Bionic | A12 Bionic | |
Кэш L1 | 48 Кб + ? | 32 Кб + ? |
Буфер ассоциативной трансляции кэша L1 | 128 страниц (2 Мб) | 128 страниц (2 Мб) |
Кэш L2 (доступно) | 3 Мб (2.5 Мб) | 2 Мб (1.5 Мб) |
Буфер ассоциативной трансляции кэша L2 | 1024 страниц (8 Мб) | 512 страниц (4 Мб) |
Продолжительность сложения чисел с плавающей точкой | 3 цикла | 4 цикла |
Продолжительность деления чисел с плавающей точкой (одинарной точности) | 9 циклов | 12 циклов |
Продолжительность деления чисел с плавающей точкой (двойной точности) | 10 циклов | 19 циклов |
Кол-во ALU, устанавливающих флаги состояния | 2 | 1 |
Время задержки при доступе к DRAM | 340 нс | 140-150 нс |
Как видим, микроархитектура производительных ядер не претерпела существенных изменений — чего нельзя сказать про энергоэффективные. Правда, кое в чем у последних наблюдается регресс — задержка при доступе к оперативной памяти выросла более чем вдвое. Это связано с изменением политики DVFS (динамического изменения напряжения и частоты), которые отныне не позволяют младшим ядрам увеличивать частоты контроллера памяти. По этой причине в некоторых тестах производительность A13 Bionic оказалась даже ниже, чем у A12 Bionic.
Теперь обратимся к результатам тестирования производительности. Вот как они выглядят в синтетическом бенчмарке SPEC2006. Напомню, что слева показаны мощность (т.е. скорость энергопотребления) — например, 4.61 Вт (Дж/сек), а также общее энергопотребление за время теста — например, 11135 Дж (Вт⋅с), т.е. 3 Вт⋅ч. В свою очередь справа — общая производительность (например, 52.82 баллов). Как видим, при энергопотреблении процессора в 3 Вт⋅ч, производительное ядро A13 Bionic (Lightning) показывает производительность почти вдвое выше, чем у «толстых» ядер его соперников.
Но что самое примечательное, по уровню быстродействия в этом тесте ядро процессора для смартфонов занимает промежуточное положение (52.82 баллов) между ядрами самых топовых десктопных процессоров, AMD Ryzen 3900X (49.02) и Intel Core 9900K (54.28). Эти цифры вполне соответствуют результатам другого, гораздо более популярного теста, Geekbench 5 (по данным его официального сайта):
Процессор | Конфигурация | Производительность одноядерная | Производительность многоядерная |
Intel Core i9-9900K, 95 Вт | 8 ядер, 3.6 ГГц | 1,341 | 8,720 (70%) |
Apple A13 Bionic | 2+4 ядер, 2.66 ГГц | 1,329 (99%) | 3,419 (28%) |
AMD Ryzen 3900X, 105 Вт | 12 ядер, 3.8 ГГц | 1,287 (96%) | 12,390 |
Apple A12X Bionic | 4+4 ядер, 2.5 ГГц | 1,114 (83%) | 4,614 (37%) |
Apple A12 Bionic | 2+4 ядер, 2.5 ГГц | 1,109 (83%) | 2,632 (21%) |
Intel Core i7-4770K, 84 Вт (2013) | 4 ядра, 3.5 ГГц | 986 (74%) | 3,734 (30%) |
Apple A11 Bionic | 2+4 ядер, 2.3 ГГц | 922 (69%) | 2,310 (19%) |
Samsung Exynos 9820 | 2+2+4 ядер, 2.0 ГГц | 760 (57%) | 2,137 (17%) |
Qualcomm Snapdragon 855 | 4+4 ядер, 1.8 ГГц | 725 (54%) | 2,664 (22%) |
Huawei HiSilicon Kirin 980 | 2+2+4 ядер, 1.8 ГГц | 676 (50%) | 2,297 (19%) |
Apple A7 (2013) | 2 ядра, 1.3 ГГц | 259 (19%) | 474 (4%) |
Итак, что мы видим помимо того, что в одноядерной скорости процессор iPhone 11 занял промежуточное место между двумя современными топовыми процессорами для ПК и почти вдвое опередил своих мобильных конкурентов? То, что собственно и стало причиной уравнения ядра A13 Bionic с ядрами Core i9-9900K и Ryzen 3900X — опережающий, по сравнению с десктопными процессорами Intel и AMD, рост производительности мобильных чипов Apple. Если с 2013 года одноядерная производительность процессоров Intel выпосла c 986 до 1341 баллов, т.е. на 36%, то у процессоров Apple она взлетела с 259 до 1329 баллов, т.е. в 5 раз.
Одной из главных причин этой разницы в росте производительности мобильных и десктопных процессоров является разная динамика техпроцессов. В случае с Intel мы имеем переход с 22 нм на 14 нм, а в случае с Apple — переход от Samsung 28 нм к TSMC 7 нм (2-е поколение). Плотность размещения транзисторов в этих техпроцессах выглядит следующим образом:
Год | Техпроцесс | Процессор | Кол-во транзисторов на 1 мм2 |
2020 | Intel 10 нм | — | 100.8 млн |
2018 | Intel 14 нм | Intel Core i9-9900K | 37.5 млн |
2013 | Intel 22 нм | Intel Core i7-4770K | 15.3 млн |
2020 | TSMC 5 нм | Apple A14 | 124 млн |
2019 | TSMC 7 нм (2-е поколение) | Apple A13 Bionic | 86.3 млн 1 |
2013 | Samsung 28 нм | Apple A7 | 9.8 млн 2 |
1 из расчета 98.48 мм2 и 8.5 млрд транзисторов
2 из расчета 102 мм2 и 1 млрд транзисторов (по данным Википедии)
Таким образом, у мобильных чипов плотность размещения транзисторов с 2013 года выросла в 8.8 раз, а у десктопных процессоров Intel — в 2.5 раза. Ну и конечно не будем забывать об опережающей, за счет архитектуры и лучшей интеграции с собственным программным обеспечением, производительности процессоров самой Apple — по сравнению с конкурентами она вдвое выше.
В сухом остатке мы имеем топовый мобильный процессор на базе архитектуры ARM, который в одноядерной производительности сравнялся с топовыми десктопными x86-процессорами, чьи энергопотребление и цена в несколько раз выше. В этом смысле, пафосно выражаясь, мы переживаем исторический момент.
В то же время ядерная гонка на десктопных процессорах сказывается больше. Архитектура big.LITTLE мобильных чипов подразумевает, что основная нагрузка ложится на big-ядра — а их количество (2 шт) в процессорах Apple с 2013 года осталось неизменным. У десктопных процессоров деления на производительные и энергоэффективные ядра нет. Поэтому увеличение общего количества ядер привел к тому, что общая, многоядерная, производительность у топового процессора Intel за последние 5-6 лет выросла с 3734 до 8720, т.е. в 2.3 раза (одноядерная, напоминаю, только на 36%). У мобильного процессора Apple она выросла еще больше, с 474 до 3419, т.е. в 7.2 раз, но в любом случае это только 39% от десктопной производительности (если сравнивать с 12-ядерным AMD Ryzen 3900X — 28%). А в следующем году ожидается релиз десктопных процессоров Intel на базе 10-нм техпроцесса, где плотность размещения транзисторов увеличится в 2.7 раз — тогда как у Apple A14, по данным IBS Research, только на 44%.
Однако SPEC2006 с Geekbench 5 — далеко не единственные тесты. Предлагаю вашему вниманию результаты тестирования A13 Bionic в других бенчмарках. Начнем с браузерной производительности:
iPhone 11 (A13 Bionic) | iPhone XS (A12 Bionic) | iPhone X (A11 Bionic) | Asus ROG Phone II (Snapdragon 855 Plus) | Galaxy S10+ (Exynos 9820) | Huawei P30 Pro (Kirin 980) | |
Speedometer 2.0 | 159 | 132 (83%) | 97.5 (61%) | 71.5 (45%) | 59.1 (37%) | 68 (43%) |
JetStream 2 | 129.15 | 114.51 (89%) | 98.67 (76%) | ? | 48.34 (37%) | 62.27 (48%) |
WebXPRT 3 | 188 | 153 (81%) | 143 (76%) | 100 (53%) | 97 (52%) | 111 (59%) |
Устойчивая (после троттлинга) графическая производительность:
iPhone 11 / Pro (A13 Bionic) | iPhone XS (A12 Bionic) | iPhone X (A11 Bionic) | Asus ROG Phone II (Snapdragon 855 Plus) | Galaxy S10+ (Exynos 9820) | Huawei P30 / Pro (Kirin 980) | |
3DMark Sling Shot Extreme (ES 3.1) — Физика | 2,333 (53%) | 2,910 (66%) | 1,881 (43%) | 3,597 (82%) | 3,582 (81%) | 4,396 |
3DMark Sling Shot Extreme (ES 3.1) — Графика | 4,495 / 5,904 (57% / 75%) | 3,929 (50%) | 2,884 (37%) | 7,870 | 3,150 (40%) | 4,352 / 3,208 (55% / 41%) |
GFXBench Aztec Ruins — High (off-screen) | 19.54 / 22.56 (87% / -) | 15.02 (67%) | 9.3 (41%) | 19.7 (87%) | 13.73 (61%) | 12.46 (55%) |
Здесь прежде всего надо сделать оговорку, что из протестированных AnandTech смартфонов с процессором Snapdragon 855 в эту таблицу отобран самый производительный, Asus ROG Phone II (Snapdragon 855 Plus, 12 Гб и воздушное охлаждение). Отсюда результат, сопоставимый с iPhone 11, в бенчмарке GFXBench Aztec Ruins — High (off-screen) — 19.7 к/с VS 19.54 к/с. Для сравнения, оснащенная Snapdragon 855 американо-китайская версия Galaxy S10+ в том же тесте набирает скромные 11.06 к/с.
Также особого внимания заслуживает 30% увеличение устойчивой производительности iPhone 11 по сравнению с его прошлогодним предшественником (при том, что заявленный Apple номинальный прирост скорости — 20%). Речь идет о вышеупомянутом бенчмарке GFXBench Aztec Ruins — High (off-screen), в котором процессоры Apple традиционно лидируют. При этом температура корпуса не нагревается выше 41°C (мощность смартфона при этом колеблется от 4 Вт до 6 Вт). AnandTech пишет, что некоторые Android-смартфоны нагревались сильнее, но конкретных моделей и цифр не называет.
А вот в 3DMark Sling Shot Extreme (ES 3.1) наблюдается двойная странность:
- В тесте Физика (в котором основная нагрузка ложится на ЦПУ) новый процессор Apple оказался заметно хуже своего предшественника — 2333 VS 2910 (+25%). Можно предположить, что это связано с двойным увеличением времени задержки у A13, по сравнению с A12, при доступе к DRAM.
- В тесте Графика (основная нагрузка — на ГПУ) Pro-версия iPhone 11 существенно быстрее стандартной версии: 5904 (+31%) VS 4495. Результаты Huawei P30 и P30 Pro еще более странные: 4352 (+36%) VS 3208 (т.е. Pro-версия медленнее стандартной).
А вот до топовых видеокарт ГПУ процессоров Apple еще очень далеко. По данным чарта на сайте GFXBench, в тесте Aztec Ruins — High (off-screen) король графических ускорителей Titan RTX набирает 366 к/с. И даже самая бюджетная модель в линейке современных видеокарт Nvidia, RTX 2060 (DirectX), производительнее A13 Bionic в 8 раз (179 к/с).
Тем не менее, на примере мобильной консоли Nintendo Switch можно видеть, что даже очень требовательные игры (Doom, Outlast 2, Wolfenstein II, или вышедший на днях Ведьмак 3) возможно вполне качественно портировать с десктопных приставок последнего поколения на устройство с мобильным процессором, который был анонсирован почти 5 лет назад. В тесте Aztec Ruins — High (off-screen) приставка Nvidia Shield TV c этим процессором показывает 13.5 к/с. Очевидно, что устойчивая производительность портативной версии Nintendo Switch еще ниже, поэтому в этом графическом тесте A13 Bionic как минимум вдвое производительнее Tegra X1. Если принять во внимание включенную в iOS 13 поддержку игровых контроллеров PlayStation 4 и Xbox One S, у iPhone с iPad имеется большой потенциал в качестве игровой платформы.
В заключение остается напомнить, что согласно таким авторитетным источникам как Bloomberg и Минг-Чи Куо, в 2020-2021 году Apple начнет оснащать своими процессорами не только смартфоны с планшетами, но и ноутбуки с десктопными компьютерами. И как мы видим, с точки зрения быстродействия ЦПУ предпосылки для этого уже имеются.