Alder Lake и Sapphire Rapids: подробности о новых процессорах Intel

На прошлой неделе в рамках Intel Architecture Day 2021 компания представила самое значительное, по словам Раджа Кодури, обновление линейки своих процессоров за последние 10 лет — семейства Alder Lake (для ноутбуков и ПК) и Sapphire Rapids (для серверов и дата-центров). Это уже 12-е поколение процессоров Core:

СемействоМикроархитектура
10-е поколениеIce Lake (ноутбуки, серверы)
Comet Lake (ноутбуки, ПК, серверы)
Sunny Cove
Skylake
11-е поколениеTiger Lake (ноутбуки, ПК)
Rocket Lake (ПК, серверы)
Willow Cove
Cypress Cove
12-е поколениеAlder Lake (ноутбуки, ПК)
Sapphire Rapids (серверы)
Golden Cove / Gracemont

Alder Lake — первые (не считая свернутого впоследствии семейства Lakefield) десктопные процессоры с концепцией а-ля big.LITTLE. Т.е. в них два типа ядер: производительные (с микроархитектурой Golden Cove) и энергоэффективные (Gracemont). За оптимальное распределение нагрузки Windows 11 на производительные и энергоэффективные ядра процессоров Alder Lake отвечает технология под названием Thread Director. В её основе — специальный микроконтроллер, которые имеется в каждом ядре Golden Cove и производит регулярный обмен своими телеметрическими данными с операционной системой (процесс занимает миллионные доли секунды). Разработчики приложений смогут в какой-то мере управлять этим процессором посредством API PowerThrottling. Одним из уже оптимизированных таким образом приложений стал браузер Microsoft Edge.

Улучшения в новой микроархитектуре Golden Cove сопоставимы с нововведениями Skylake и Sunny Cove:

Golden Cove
(2021)
Sunny Cove
(2019)
Skylake
(2015)
Haswell
(2013)
Кол-во декодеров6443
Скорость (кол-во микроопераций за такт) декодера6554
Кэш L1 (данные)48 Кб48 Кб32 Кб32 Кб
Буфер ассоциативной трансляции L1 для данных (кол-во записей), обычные/большие страницы966464 / 3264 / 32
Кэш L1 (инструкции)32 Кб32 Кб32 Кб32 Кб
Буфер ассоциативной трансляции L1 для инструкций (кол-во записей), обычные/большие страницы256 / 32128 / 16128 / 8128 / 8
Ассоциативность L1161288
Буфер загрузки (load)?1287272
Буфер сохранения (store)?725642
Кэш L2 (ПК / серверы)1.25 Мб / 2 Мб512 Кб / 1.25 Мб256 Кб256 Кб
Буфер ассоциативной трансляции L2 (кол-во записей)2048 (?)204815361024
Буфер предсказания ветвлений (Branch Target Buffer)12 тыс5 тыс4 тыс1 тыс
Кэш микроопераций4 тыс2.25 тыс1.5 тыс1.5 тыс
Пропускная способность кэша микроопераций (за такт)8664
Буфер переупорядочивания микроопераций512352224182
Кол-во целочисленных ALU5433

Среди наиболее значительных улучшений стоит отметить увеличение:

  • кэша L2 — с 512 Кб до 1.25 Мб в версии для ПК, с 1.25 Мб до 2 Мб в версии для сервера;
  • числа декодеров, преобразующих длинные x-86 команды (CISC) в короткие микрооперации (RISC) — c 4 до 6, ускорение декодера — с 5 до 6 микроопераций за такт;
  • кэша микроопераций — с 2.25 до 4 тыс, его пропускной способности — с 6 до 8 за такт;
  • буфера предсказания ветвлений (Branch Target Buffer) — с 5 до 12 тыс записей (для сравнения, в микроархитектуре AMD Zen 3 — 6.5 тыс);
  • буфера переупорядочивания микроопераций — с 352 до 512 (более чем вдвое превосходит Zen 3, но все еще уступает 630 микроопераций в ядре Firestorm процессора Apple M1);
  • исполнительных портов — с 10 до 12:
  • блоков целочисленных ALU — с 4 до 5.

Согласно Intel, по сравнению с Cypress Cove (по сути — Sunny Cove для 14-нм процессоров) в Rocket Lake производительность Golden Cove в среднем (по данным бенчмарков SPEC CPU 2017, Sysmark 25, Crossmark, PCMark 10, WebXPRT3, Geekbench) выше на 19% (на одинаковой частоте). А согласно опубликованным на сайте бенчмарка Geekbench 5 свежим результатам, 16-ядерный Intel Core i9-12900K (официальный анонс которого состоится осенью, предположительно в октябре), в однопоточной и многопоточной тестах набирает 1893 и 17299 баллов. Это заметно лучше, чем у 16-ядерного AMD Ryzen 9 5950X (1691 и 16720 баллов), хотя по сравнению с 8-ядерным Intel Core i9-11900K (1856 и 10997 баллов) однопоточная скорость выросла всего на 2%. В любом случае переход с 8-ядерной конфигурации на 16-ядерную в топовом процессоре для ПК весьма впечатляет. Правда, это 8+8: 8 производительных ядер с архитектурой Golden Cove и 8 энергоэффективных ядер Gracemont. Последние работают только в однопоточном режиме, поэтому итоговая многопоточность достигает (8 x 2) + 8 = 24 потоков. Поддержка AVX-512 и AMX имеется только в процессорах для дата-центров (Sapphire Rapids), так что в мобильных и десктопных процессорах Alder Lake она отсутствует.


В свою очередь Gracemont — это очередное поколение ядер Atom. Его предшественниками были: Tremont (2020), Goldmont и Goldmont Plus (2016-2017), Airmont (2014) и другие. В числе изменений по сравнению с Tremont — увеличение:

  • кэша инструкций L1 — с 32 Кб до 64 Кб;
  • буфера переупорядочивания микроопераций — с 208 до 256;
  • исполнительных портов — с 8 до 17 (включая 4 целочисленных ALU и 3 ALU с плавающей точкой).

Gracemont не поддерживает расширения команд AVX-512 и AMX, но зато поддерживает VNNI и AVX 2 (впервые среди процессоров Atom).

Новая микроархитектура имеет беспрецедентно высокую для Atom производительность — в однопоточной (а ядра Gracemont работают только в однопоточном режиме) она превосходит Skylake на 40% (при том же уровне энергопотребления), либо (что более актуально для Atom) равна ему — при 40% снижении энергопотребления. Поскольку в многопоточном режиме ядро Skylake всего на 20-30% быстрее по сравнению со своим однопоточным режимом, ядро Gracemont остается в выигрыше — при том, что четыре таких ядра занимают примерно столько же места, сколько одно ядро Skylake.


Представители семейств Alder Lake и Sapphire Rapids будут выпускаться на базе 7-нм техпроцесса Intel (бывший 10 нм Enhanced SuperFin) в диапазоне TDP от 9 Вт до 125 Вт. Имеется поддержка PCIe 5.0 (x16, 64 Гб/с), DDR5, Thunderbolt 4 и Wi-Fi 6E. Максимальная десктопная конфигурация: 8 + 8 ядер (до 24 потоков), кэш L3 — до 30 Мб. Серверные Sapphire Rapids получат чиплетную компоновку (четыре чипа, соединенных интерфейсом EMIB с кольцевой топологией и пропускной способностью 1000 Гб/с), поддержку AVX-512, DSA и AMX. У некоторых версий в чиплет будет встроена память HBM2E.

За оптимальное распределение нагрузки Windows 11 на производительные и энергоэффективные ядра процессоров Alder Lake отвечает технология под названием Thread Director. В её основе — специальный микроконтроллер, которые имеется в каждом ядре Golden Cove и производит регулярный обмен своими телеметрическими данными с операционной системой (процесс занимает миллионные доли секунды). Разработчики приложений смогут в какой-то мере управлять этим процессором посредством API PowerThrottling. Одним из уже оптимизированных таким образом приложений стал браузер Microsoft Edge. Судя по всему, в Windows 10 и более ранних версиях Thread Director отсутствует — это делает будущую ОС наиболее адаптированной для работы на процессорах Alder Lake.