Alder Lake и Sapphire Rapids: подробности о новых процессорах Intel
На прошлой неделе в рамках Intel Architecture Day 2021 компания представила самое значительное, по словам Раджа Кодури, обновление линейки своих процессоров за последние 10 лет — семейства Alder Lake (для ноутбуков и ПК) и Sapphire Rapids (для серверов и дата-центров). Это уже 12-е поколение процессоров Core:
Семейство | Микроархитектура | |
10-е поколение | Ice Lake (ноутбуки, серверы) Comet Lake (ноутбуки, ПК, серверы) | Sunny Cove Skylake |
11-е поколение | Tiger Lake (ноутбуки, ПК) Rocket Lake (ПК, серверы) | Willow Cove Cypress Cove |
12-е поколение | Alder Lake (ноутбуки, ПК) Sapphire Rapids (серверы) | Golden Cove / Gracemont |
Alder Lake — первые (не считая свернутого впоследствии семейства Lakefield) десктопные процессоры с концепцией а-ля big.LITTLE. Т.е. в них два типа ядер: производительные (с микроархитектурой Golden Cove) и энергоэффективные (Gracemont). За оптимальное распределение нагрузки Windows 11 на производительные и энергоэффективные ядра процессоров Alder Lake отвечает технология под названием Thread Director. В её основе — специальный микроконтроллер, которые имеется в каждом ядре Golden Cove и производит регулярный обмен своими телеметрическими данными с операционной системой (процесс занимает миллионные доли секунды). Разработчики приложений смогут в какой-то мере управлять этим процессором посредством API PowerThrottling. Одним из уже оптимизированных таким образом приложений стал браузер Microsoft Edge.
Улучшения в новой микроархитектуре Golden Cove сопоставимы с нововведениями Skylake и Sunny Cove:
Golden Cove (2021) | Sunny Cove (2019) | Skylake (2015) | Haswell (2013) | |
Кол-во декодеров | 6 | 4 | 4 | 3 |
Скорость (кол-во микроопераций за такт) декодера | 6 | 5 | 5 | 4 |
Кэш L1 (данные) | 48 Кб | 48 Кб | 32 Кб | 32 Кб |
Буфер ассоциативной трансляции L1 для данных (кол-во записей), обычные/большие страницы | 96 | 64 | 64 / 32 | 64 / 32 |
Кэш L1 (инструкции) | 32 Кб | 32 Кб | 32 Кб | 32 Кб |
Буфер ассоциативной трансляции L1 для инструкций (кол-во записей), обычные/большие страницы | 256 / 32 | 128 / 16 | 128 / 8 | 128 / 8 |
Ассоциативность L1 | 16 | 12 | 8 | 8 |
Буфер загрузки (load) | ? | 128 | 72 | 72 |
Буфер сохранения (store) | ? | 72 | 56 | 42 |
Кэш L2 (ПК / серверы) | 1.25 Мб / 2 Мб | 512 Кб / 1.25 Мб | 256 Кб | 256 Кб |
Буфер ассоциативной трансляции L2 (кол-во записей) | 2048 (?) | 2048 | 1536 | 1024 |
Буфер предсказания ветвлений (Branch Target Buffer) | 12 тыс | 5 тыс | 4 тыс | 1 тыс |
Кэш микроопераций | 4 тыс | 2.25 тыс | 1.5 тыс | 1.5 тыс |
Пропускная способность кэша микроопераций (за такт) | 8 | 6 | 6 | 4 |
Буфер переупорядочивания микроопераций | 512 | 352 | 224 | 182 |
Кол-во целочисленных ALU | 5 | 4 | 3 | 3 |
Среди наиболее значительных улучшений стоит отметить увеличение:
- кэша L2 — с 512 Кб до 1.25 Мб в версии для ПК, с 1.25 Мб до 2 Мб в версии для сервера;
- числа декодеров, преобразующих длинные x-86 команды (CISC) в короткие микрооперации (RISC) — c 4 до 6, ускорение декодера — с 5 до 6 микроопераций за такт;
- кэша микроопераций — с 2.25 до 4 тыс, его пропускной способности — с 6 до 8 за такт;
- буфера предсказания ветвлений (Branch Target Buffer) — с 5 до 12 тыс записей (для сравнения, в микроархитектуре AMD Zen 3 — 6.5 тыс);
- буфера переупорядочивания микроопераций — с 352 до 512 (более чем вдвое превосходит Zen 3, но все еще уступает 630 микроопераций в ядре Firestorm процессора Apple M1);
- исполнительных портов — с 10 до 12:
- блоков целочисленных ALU — с 4 до 5.
Согласно Intel, по сравнению с Cypress Cove (по сути — Sunny Cove для 14-нм процессоров) в Rocket Lake производительность Golden Cove в среднем (по данным бенчмарков SPEC CPU 2017, Sysmark 25, Crossmark, PCMark 10, WebXPRT3, Geekbench) выше на 19% (на одинаковой частоте). А согласно опубликованным на сайте бенчмарка Geekbench 5 свежим результатам, 16-ядерный Intel Core i9-12900K (официальный анонс которого состоится осенью, предположительно в октябре), в однопоточной и многопоточной тестах набирает 1893 и 17299 баллов. Это заметно лучше, чем у 16-ядерного AMD Ryzen 9 5950X (1691 и 16720 баллов), хотя по сравнению с 8-ядерным Intel Core i9-11900K (1856 и 10997 баллов) однопоточная скорость выросла всего на 2%. В любом случае переход с 8-ядерной конфигурации на 16-ядерную в топовом процессоре для ПК весьма впечатляет. Правда, это 8+8: 8 производительных ядер с архитектурой Golden Cove и 8 энергоэффективных ядер Gracemont. Последние работают только в однопоточном режиме, поэтому итоговая многопоточность достигает (8 x 2) + 8 = 24 потоков. Поддержка AVX-512 и AMX имеется только в процессорах для дата-центров (Sapphire Rapids), так что в мобильных и десктопных процессорах Alder Lake она отсутствует.
В свою очередь Gracemont — это очередное поколение ядер Atom. Его предшественниками были: Tremont (2020), Goldmont и Goldmont Plus (2016-2017), Airmont (2014) и другие. В числе изменений по сравнению с Tremont — увеличение:
- кэша инструкций L1 — с 32 Кб до 64 Кб;
- буфера переупорядочивания микроопераций — с 208 до 256;
- исполнительных портов — с 8 до 17 (включая 4 целочисленных ALU и 3 ALU с плавающей точкой).
Gracemont не поддерживает расширения команд AVX-512 и AMX, но зато поддерживает VNNI и AVX 2 (впервые среди процессоров Atom).
Новая микроархитектура имеет беспрецедентно высокую для Atom производительность — в однопоточной (а ядра Gracemont работают только в однопоточном режиме) она превосходит Skylake на 40% (при том же уровне энергопотребления), либо (что более актуально для Atom) равна ему — при 40% снижении энергопотребления. Поскольку в многопоточном режиме ядро Skylake всего на 20-30% быстрее по сравнению со своим однопоточным режимом, ядро Gracemont остается в выигрыше — при том, что четыре таких ядра занимают примерно столько же места, сколько одно ядро Skylake.
Представители семейств Alder Lake и Sapphire Rapids будут выпускаться на базе 7-нм техпроцесса Intel (бывший 10 нм Enhanced SuperFin) в диапазоне TDP от 9 Вт до 125 Вт. Имеется поддержка PCIe 5.0 (x16, 64 Гб/с), DDR5, Thunderbolt 4 и Wi-Fi 6E. Максимальная десктопная конфигурация: 8 + 8 ядер (до 24 потоков), кэш L3 — до 30 Мб. Серверные Sapphire Rapids получат чиплетную компоновку (четыре чипа, соединенных интерфейсом EMIB с кольцевой топологией и пропускной способностью 1000 Гб/с), поддержку AVX-512, DSA и AMX. У некоторых версий в чиплет будет встроена память HBM2E.
За оптимальное распределение нагрузки Windows 11 на производительные и энергоэффективные ядра процессоров Alder Lake отвечает технология под названием Thread Director. В её основе — специальный микроконтроллер, которые имеется в каждом ядре Golden Cove и производит регулярный обмен своими телеметрическими данными с операционной системой (процесс занимает миллионные доли секунды). Разработчики приложений смогут в какой-то мере управлять этим процессором посредством API PowerThrottling. Одним из уже оптимизированных таким образом приложений стал браузер Microsoft Edge. Судя по всему, в Windows 10 и более ранних версиях Thread Director отсутствует — это делает будущую ОС наиболее адаптированной для работы на процессорах Alder Lake.