Graphcore одной из первых перейдет на 3-нм техпроцесс
Прошедшая на днях конференция TSMC Technology Symposium ознаменовалась несколькими интересными анонсами, и одним из стали подробности о 3-нм техпроцессе. Компания объявила, что массовый выпуск процессоров с 3-нм литографией стартует во 2-й половине 2022. По сравнению с 5-нм техпроцессом (чей релиз состоится уже в сентябре, с началом продаж iPhone 12), 3-нм обещает 15% рост производительности или 30% снижение энергопотребления, при этом площадь чипа с заданным количеством транзисторов уменьшится на 45%.
Одной из первых процессоры с 3-нм техпроцессом будет выпускать британская компания Graphcore. Она была основана в 2016 и уже в июле этого года представила 2-е поколение своего ИПУ (интеллектуальное процессорное устройство), Mk2 GC200.
Характеристики процессора впечатляют:
- техпроцесс 7-нм
- площадь 823 мм2
- 59.4 млрд транзисторов, 1472 ядер, 8832 потоков
- встроенная память 900 Мб с пропускной способностью 47.5 Тб/с
- производительность 250 терафлопс в операциях машинного обучения.
На базе четырех процессоров Mk2 GC200, соединенных между собой каналом IPU-Exchange (пропускная способность — 8 Тб/с) создана рабочая станция M2000 производительностью 1 петафлопс в операциях машинного обучения. Mk2 GC200 поддерживает до 450 Гб внешней памяти, доступ к которой реализован с невероятной пропускной способностью 180 Тб/с.
Для объединения нескольких рабочих станций в одну стойку предназначен канал IPU-Fabric и чип GC4000, посредством которого пропускная способность между рабочими станциями достигает 2.8 Тбит/с. Graphcore заявляет, что в обучении классификации изображений производительность стойки из восьми GC4000 ($259.6 тыс) соответствует шестнадцати Nvidia DGX A100 ($3 млн).
В еще более крупные вычислительные кластеры несколько стоек объединяются посредством канала IPU-Links (пропускная способность между процессорами — 320 Гб/с), либо традиционного PCIe Gen4 (пропускная способность между стойками — 64 Гб/с).
Продажи новых рабочих станций Graphcore начнутся в 4 кв 2020. На рынке вычислений для машинного обучения им предстоит конкуренция, в частности, с системами на базе графических ускорителей Nvidia и AMD, со-процессоров Intel Xeon Phi и тензорных процессорных устройств Google TPU.