Nvidia Tegra X1: самый производительный мобильный чипсет в мире

Около трех часов назад завершилась презентация, на которой Nvidia анонсировала мобильный чипсет следующего поколения — Tegra X1. Ранее мы сообщали, что трансляция начнется в 08:00 по московскому времени, но на самом деле это произошло в 07:00. Вероятно, в наши расчеты вкралась какая-то ошибка, за что приносим свои извинения. В любом случае, запись трансляции можно посмотреть на сайте компании.

Как и обещалось в дорожной карте, новый процессор построен на архитектуре Maxwell. Он оснащен 64-разрядным 20-нанометровым 8-ядерным ЦПУ (4 x Cortex-A57 + 4 x Cortex-A53), 256-ядерным ГПУ и поддержкой записи 10-битного 4K-видео стандарта H.265/VP9 со скоростью 60 к/с. Подробные характеристики ЦПУ и ГПУ Nvidia Tegra X1 представлены ниже:

Tegra K1 Tegra X1
Архитектура Kepler Maxwell
Техпроцесс TSMC 28нм TSMC 20нм
Разрядность 32/64 64
Кол-во ядер CUDA 192 256
Кол-во TMU 8 16
Кол-во ROP 4 16
Тактовая частота ГПУ ~950 МГц ~1000 МГц
Частота и тип памяти 930 МГц (LPDDR3) 1600 МГц (LPDDR4)
Разрядность шины памяти 64-бит 64-бит
Производительность FP16 365 гигафлопс 1024 гигафлопс
Производительность FP32 365 гигафлопс 512 гигафлопс

Тактовая частота ГПУ была получена из тождества: 1 ГГц x 2 FP16 x 2 FMA x 256 = 1 терафлопс

Обратите внимание, что разрядность памяти Tegra X1 осталась на том же уровне, что и в Tegra K1 — 64 бит. Для сравнения в Apple A8X она выше в 2 раза — 128 бит. Таким образом, разрядность памяти рискует стать «бутылочным горлышком» нового чипсета — в случае, если это не будет компенсировано более эффективным сжатием проходящего через шину памяти трафика. Это вполне вероятно, поскольку в отличие от DDR3 в Apple A8X, в Tegra X1 используется более современный стандарт памяти, LPDDR4. В частности, скорость обмена данных между процессором и оперативной памятью выросла с 14.9 Гб/с до 25.6 Гб/с (как в iPad Air 2 с процессором Apple A8X), при этом снизилось энергопотребление:

Согласно производителю, Tegra X1 имеет тот же «процессор» (engine), что и топовые ПК и игровые консоли следующего поколения. Производительность графического ускорителя превышает 1 терафлопс в вычислениях FP16 (степень точности, с которой в этих вычислительных блоках рассчитываются числа с плавающей точкой).

tegrax1-4

Любопытно, что такую же производительность для своего топового графического ускорителя PowerVR GT7900 пообещала Imagination Technologies, но в отличие от Tegra X1, он имеет не 256 ядер, а в два раза больше — 512. И так же, как графические ускорители серии PowerVR Series7XT, Tegra X1 содержит аппаратную поддержку FP16-вычислений. Судя по представленному на презентации графику, производительность Nvidia Tegra X1 по сравнению с Tegra K1 и Apple A8X в тесте GFBench 3.0 Manhattan (Offscreen) выросла в 2 раза, GFBench 3.0 T-Rex — в 1.7-1.8 раз, 3Dmark 1.3 и Icestorm BasemarkX 1.1 — в 1.5 раза.

Тесты Apple A8X Tegra K1 Tegra X1
BaseMark X 1.1 Dunes (Offscreen) 40.2 к/с 36.3 к/с 56.9 к/с
3DMark 1.2 Unlimited 31,781 36,688 58,448
GFXBench 3.0 Manhattan 1080p (Offscreen) 32.6 к/с 31.7 к/с 63.6 к/с

При этом эффективность нового чипсета (производительность на 1 Вт потребленной электроэнергии) выросла в 2 раза.

Tegra K1 бенчмарки

tegraX1-2

Для сравнения, производительность в 1 терафлопс (правда, в вычислениях FP64) в 2000 году имели суперкомпьютеры, потребляя при этом миллион ватт электроэнергии — у Tegra X1 этот показатель составляет 10 Вт.

Фото Engadget

Конечно, по сравнению с 2000 годом прогресс выглядит весьма впечатляюще, но для планшета 10 Вт, на наш взгляд, многовато. Правда, по данным наших коллег из AnandTech, фактическое энергопотребление графического ускорителя Tegra X1 (без ЦПУ) оказалось даже ниже, чем у PowerVR GXA6850 в чипсете Apple A8X от iPad Air 2. В частности, в тесте GFBench 3.0 Manhattan его среднее значение составило 1.5 Вт у Tegra X1 против 2.7 Вт у ГПУ Apple A8X:

В любом случае, чипсет на использование в планшетах и мобильных игровых консолях явно рассчитан, поскольку имеет поддержку DirectX 12, OpenGL 4.5 и даже Unreal Engine 4 — игрового движка, используемого в играх для приставок последнего поколения, PlayStation 4 и Xbox One (энергопотребление которых составляет около 100 Вт). Написанный на Unreal Engine 4 и запущенный, как утверждается, на Tegra X1 демо-ролик Elemental (с рендерингом в режиме реального времени) во всей красе был продемонстрирован на презентации.

tegraX1-3

А вот для смартфонов, по словам главы Nvidia Джен-Сан Хуанга, такая мощь не предназначена, и не случайно большая часть сегодняшнего мероприятия была посвящена использованию Tegra X1 в автомобилях. На презентации были представлены два бортовых компьютера для автомобиля: Drive CX (с одним Tegra X1) и Drive PX (с двумя Tegra X1). Первый из них является помощником водителя (в трехмерном виде демонстрируя данные бортовых приборов, навигацию и т.д.), а второй этого водителя фактически заменяет, представляя собой, таким образом, систему автопилота. Как вы можете видеть на фото, Drive PX имеет производительность в 2.3 терафлопс и способен обрабатывать видео, поступающее из 12 камер со скоростью в 1.3 гигапикселя в секунду.

Компьютер способен различать сигналы светофора, дорожные знаки, камеры безопасности дорожного движения, типы автомобилей (включая полицейские машины и школьные автобусы), категории пешеходов.

Фактически речь идет о системе искусственного интеллекта, способной к распознаванию визуальных образов в режиме реального времени. Судя по всему, в ближайшие годы нечто подобное станет таким же привычным атрибутом автомобиля, каким сейчас является автоматическая коробка передач. Сама Nvidia первое появление бортовых компьютеров Drive CX и Drive PX в автомобилях обещает в 2016 году.

С использованием данных Nvidia и AnandTech