Встречайте Майка, он же аватар MEETMIKE

На проходящей в эти дни в Лос-Анджелосе конференции по компьютерной графике SIGGRAPH был продемонстрирован аватар со странным названием MEETMIKE («встречайте Майка»). Это еще один пример того, какого уровня реалистичности достигла компьютерная графика: выше вы видите аватар, а ниже — человека, который стал его прообразом — Майка Сеймура, специалиста по визуальным эффектам, сотрудника Сиднейского университета, кинопродюсера:

Аватар предназначен для виртуальной реальности, создан на базе популярного игрового движка Unreal Engine 4 при непосредственном участии разработавшей его компании Epic Games, и рендерится в режиме реального времени. Какая для этого потребовалась вычислительная мощность не вполне понятно. В статье Майка Сеймура говорится, что проект стал возможным благодаря девяти ПК, оснащенным видеокартой Nvidia GTX 1080 Ti и 32 Гб оперативной памяти. Аватар в ролике говорит о рендеринге в режиме реального времени в стерео для виртуальность реальности с частотой 90 к/с. А в комментариях к ролику говорится, что он был сгенерирован в режиме реального времени с частотой 30 к/с на одном ПК:

Для сравнения предлагаю взглянуть еще на видео с фотореалистичной анимацией живого человеческого лица, сгенерированного: 1) Nvidia в режиме реального времени на видеокарте GeForce GTX Titan (2013) и 2) энтузиастом по имени Крис Джонс (Chris Jones) за примерно 800 часов на 4-ядерном процессоре 2008 года:

Конечно второе лицо, потребовавшее больше месяца непрерывного рендеринга, отличается заметно большей реалистичностью и проработкой деталей, чем созданное в режиме реального времени на топовой видеокарте 2013 года. А вот MEETMIKE на топовой видеокарте 2017 года ему уже ни в чем не уступает. И возможно дело здесь не только в росте производительности за эти четыре года — при создании MEETMIKE применялся искусственный интеллект. Подробности неизвестны, но в каком направлении развиваются подобные технологии при создании реалистичной графики на днях рассказала Nvidia в двух публикациях. Одна из них посвящена преобразованию видео в компьютерную анимацию — разработка компании позволяет избежать многочасовых съемок с разных точек зрения — на них достаточно потратить всего несколько минут, в процессе которых происходит обучение. Остальное же видео можно снять с одной точки, с последующим автоматическим преобразованием в компьютерную графику. Другая публикация Nvidia посвящена получению реалистичной трехмерной анимации лица на основе одних лишь аудиоданных.

Еще одной областью прикладного применения искусственного интеллекта в компьютерной графике является, например, устранение зернистости (шума), возникающей из-за ограниченного применения трассировки лучей, использование которых в полном объеме потребует чрезвычайно высокой производительности.

Эти и другие техники машинного обучения позволяют создавать компьютерную анимацию с т.н. фотореалистичностью, причем в режиме реального времени — в отличие от спецэффектов в кино, на отрисовку которых в прошлом уходили месяцы непрерывного рендеринга на мощных графических станциях.

Кстати, на все той же конференции SIGGRAPH компания AMD представила сервер производительностью в 1 петафлопс (FP32) — Project 47. Он оснащен 80 графическими ускорителями Radeon Instinct, 20 процессорами Epyc 7601 и 10 Тб оперативной памяти с частотой 2.66 ГГц (см. фото сверху). С учетом 30 гигафлопс на один ватт потребляемой энергии, его общее энергопотребление составляет около 33 кВт. Теоретическая производительность с двойной точностью (FP64) составляет 15 гигафлопс/Вт. Для сравнения самым эффективным в мире суперкомпьютером в конце прошлого года стал Nvidia DGX SATURNV с 9.46 гигафлопс/Вт (FP64). Если быстродействие Project 47 с двойной точностью (FP64) действительно в два раз меньше его скорости с одинарной точностью (FP32), то по показателю эффективности он превзошел соперника из Nvidia в полтора раза.

В операциях с двойной точностью (FP64) производительность AMD Project 47 теоретически составляет 0.5 петафлопс (15 гигафлопс на ватт). Для сравнения созданный 10 лет назад суперкомпьютер IBM Roadrunner с производительностью один петафлопс (FP64) был оснащен 18,840 процессорами, занимал площадь 465 м2, весил 250 тонн, потреблял 2.35 МВт энергии (437 мегафлопс на ватт) и стоил $100 млн. Цена Project 47 пока неизвестна, но стоить он будет явно дешевле, чем IBM Roadrunner.

Возвращаясь к фотореалистичной компьютерной графике, необходимо сделать две важные оговорки. Во-первых, даже если отдельно взятое лицо и можно воспроизвести с такой достоверностью, то в отношении одновременно задействованных многочисленных персонажей компьютерной игры это пока не представляется возможным. Напомню, что по оценкам Тима Суини (автора того самого игрового движка Unreal Engine, на основе которого был создан аватар MEETMIKE) для этого потребуется 40 терафлопс — почти вчетверо больше самой производительной на сегодня игровой видеокарты. Во-вторых, по словам все того же Тима Суини не существует алгоритмов, которые научились бы воссоздавать в компьютерной игре интерактивные человеческие эмоции и взаимный зрительный контакт её персонажей — а это уже куда более сложная проблема. Впрочем с учетом упомянутых выше технологий искусственного интеллекта есть надежда, что со временем разработчики решат и эту задачу. А до тех пор аватары вроде MEETMIKE могут применяться для общения в среде виртуальной реальности.

С использованием данных fxguide.