Суперкомпьютер Summit в полтора раза быстрее прежнего рекордсмена

Supercomputer Summit 2018

Национальная лаборатория Ок-Ридж при Министерстве энергетики США объявила о запуске самого производительного суперкомпьютера в мире. Махина, получившая название Summit, состоит из 4,608 серверов IBM AC922, занимающих площадь в два теннисных корта. Каждый из них оснащен двумя 22-ядерными процессорами IBM Power9, шестью графическими ускорителями Nvidia Tesla V100 (NVLink 2.0), 512 Гб DDR4 и 96 Гб HBM2. О работе над созданием Summit было объявлено еще в 2014.

IBM Power9

Выпуск процессоров Power9 стартовал в прошлом году. Они созданы на базе 14-нм техпроцесса GlobalFoundries и содержат 8 млрд транзисторов. В их основе лежит RISC-архитектура — аналогично семейству ядер ARM, используемых в мобильных процессорах, и в отличие от доминирующих среди ПК x86-процессоров Intel и AMD. Впрочем и в последних, начиная с Intel Pentium Pro (1995), CISC-инструкции непосредственно перед исполнением преобразуются в инструкции RISC.

В свою очередь Tesla V100 — первый графический ускоритель Nvidia с архитектурой Volta и 12-нанометровым техпроцессом TSMC. Его ГПУ содержит 21 млрд транзисторов, а производительность в операциях с плавающей точкой с двойной точностью (FP64) составляет 7.5 терафлопс. Помимо 5,120 ядер CUDA Tesla V100 имеет 640 тензорных ядер, что позволяет ему достигать 120 терафлопс в тензорных операциях глубокого обучения с точностью FP32.

IBM AC922

Сервера IBM AC922 соединены между собой сетью стандарта InfiniBand со скоростью обмена данными 100 Гб/с, реализованной при помощи коммутаторов Mellanox EDR. Из расчета 45 терафлопс (FP64) на один сервер (заявленная производительность — 42 терафлопс), линейная масштабируемость 4,608 серверов обеспечит 207,360 терафлопс — что вполне соответствует заявленной пиковой производительности суперкомпьютера, 200 петафлопс (триллионов операций с плавающей точкой с двойной точностью в секунду). Это в 1.6 раз быстрее прежнего рекордсмена, китайского суперкомпьютера Sunway TaihuLight. Последний был запущен два года назад, в июне 2016. Его пиковая производительность — 125 петафлопс, а в бенчмарке LINPACK — 93 петафлопс. При этом суммарное энергопотребление и площадь Summit даже меньше — 13 мВт vs 15 мВт и 520 м² vs 605 м².

Непосредственным предшественником Summit в Ок-Ридж был суперкомпьютер Titan, запущенный в 2012. В таблице ниже приводятся сравнительные характеристики обеих систем:

Titan Summit изменение
Дата запуска октябрь 2012 июнь 2018 6 лет
Стоимость $97 млн
Пиковая производительность (FP64) 27 петафлопс 200 петафлопс ×7.4
Бенчмарк LINPACK 17.59 петафлопс ?
Мощность 8.2 мВт 13 мВт ×1.6
Площадь 404 м² 520 м² ×1.3
Вес 340 тонн
Объем охлаждающей воды в минуту 15 тыс. литров
Длина волоконно-оптических кабелей 298 км
Процессоры 18,688 × AMD Opteron 6274
(16-ядерные)
9,216 × IBM Power9
(22-ядерные)
Графические ускорители 18,688 × Nvidia Tesla K20x 27,648 × Nvidia Tesla V100
Память для графических ускорителей 112 Тб 442 Тб ×3.9
Память для процессоров 598 Тб 2,359 Тб ×3.9
Постоянная память 40 петабайт 250 петабайт ×6.3

Как сообщается в пресс-релизе Национальной лаборатории Ок-Ридж, «в числе прочих направлений деятельности Summit обеспечит беспрецедентную вычислительную мощь для исследований в области энергетики, продвинутых материалов и искусственного интеллекта, которые до сих пор были непрактичны или невозможны«.

Там же заявлено о намерении достигнуть экзафлопсного уровня производительности к 2021 году (очевидно на базе 10-нанометровых процессоров IBM Power10, выпуск которых запланирован на 2020 год).

Как утверждают создатели Summit, за один час этот суперкомьютер может «решить проблему, которая займет 30 лет на десктопном компьютере». Впрочем мне привычнее оперировать флопсами — топовая видеокарта Nvidia GeForce GTX 1080 Ti имеет быстродействие на уровне 11 терафлопс — это почти в 200 тысяч раз медленнее нашего героя (правда сравнение не вполне корректное — FP32 vs FP64). Но как уже рассказывал Gadgets News, за последние 40 лет производительность процессоров Intel выросла в 660 тысяч раз. Как знать — может через два-три десятилетия быстродействием Summit будут обладать скромные домашние ПК.

Национальная лаборатория Ок-Ридж