Многокристальные процессоры как альтернатива закону Мура
Несмотря на то, что номинально действие закона Мура прекратится, скорее всего, не ранее 2030 года, разработчики процессоров и видеокарт уже демонстрируют симптомы скорого наступления это драматической развязки. В июне AMD сообщила, что в её 7000-й серии серверных процессоров Epyc будет применен многокристальный принцип, т.е. вместо одного большого кристалла процессор будет содержать несколько маленьких (в 32-ядерной конфигурации — четыре). А сегодня об аналогичной технологии заявила Nvidia, опубликовавшая совместную работу с Университетом штата Аризона, Техасским университетом в Остине, а также Барселонским суперкомпьютерным центром (Испания).
В ней отмечается, что количество транзисторов на кристалле больше не растет прежними темпами (т.е. закон Мура застопоролился), а размеры кристалла уже упираются в предел (около 800 мм2), который и без того отличается очень низким процентом выхода годных кристаллов (и соответственно более высокой стоимостью их производства). В этих условиях остается лишь одно: объединять друг с другом, в рамках одного процессора, несколько кристаллов меньшего размера и соответственно гораздо более низкой стоимости. По данным исследования, такой подход позволит добиться значительного прироста производительности по сравнению с многочиповой архитектурой.
На графике ниже горизонтальная ось обозначает уровень производительности обычной одночиповой видеокарты со 128 стриминговыми микропроцессорами (SM) на цельном кристалле, а слева направо приводятся четыре конфигурации:
- многопроцессорная (двухчиповая видеокарта из двух дискретных ГПУ, по 128 SM каждое),
- многокристальная (одно ГПУ, состоящее из четырех отдельных кристаллов по 64 SM) с пропускной способностью между кристаллами 768 Гб/с,
- многокристальная (одно ГПУ, состоящее из четырех отдельных кристаллов по 64 SM) с пропускной способностью между кристаллами 6 Тб/с,
- однокристальное ГПУ (из монолитного кристалла с 256 SM).
Две последние конфигурации на нынешнем уровне технологий недостижимы.
Как следует из пояснений к графику, в двухчиповой конфигурации прирост составляет 22.8%, в технологически доступной двухкристальной — 45.5%. Судя по самому графику последняя величина немного больше — около 55%, что согласуется с заявленным отставанием от гипотетического монолитного ГПУ из 256 SM в пределах 10%. И хотя с одной стороны разочаровывает тот факт, что 2-кратное увеличение количества SM на монолитном кристалле приводит лишь к 1.65-кратному росту производительности, предлагаемая AMD и Nvidia концепция многокристальных процессоров позволяет надеятся на преодоление технологических и финансовых ограничений, сопряженных с удвоением количества транзисторов каждые два года.
Согласно Nvidia, предельно допустимое количество SM на монолитном кристалле — 128. Для сравнения на кристалле площадью 815 мм2, используемом в графическом ускорителе Tesla V100, умещается 84 SM по 64 ядра каждое.
Между тем в опубликованной недавно статье «Конец закона Мура» ученый и ведущий сотрудник исследовательской лаборатории Hewlett Packard Стэнли Уильямс высказал несколько предположений о том, как можно продолжить повышать производительность компьютеров после того, как дальнейшее наращивание числа транзисторов на кристалле станет невозможным. По его мнению, этого можно добиться путем применения ориентированных на память вычислений, специализированных процессоров (интегральных схем специального назначения, программируемых пользователем вентильных матриц и т.д.), а также фотонного интерфейса, обеспечивающего высокую скорость обмена данными.