Искусственный интеллект в кино: возможное применение в ближайшем и далеком будущем

Robots watch movies

Затронутые в недавней публикации вскользь темы кинематографа и искусственного интеллекта в играх натолкнули меня на несколько мыслей о применении последнего в кино — которыми я рискну с вами поделиться.

Должен признаться, что я не слишком большой поклонник современного кинематографа. В нем конечно попадаются прекрасные экземпляры, но в гораздо большей степени меня привлекают кинополотна старых мастеров. За последние годы они в немалом количестве появились в YouTube, смотреть — не пересмотреть. Но качество воспроизведения многих старых кинофильмов оставляет желать лучшего, ведь их оцифровывали с аналоговой пленки. Поэтому многие из них имеют разрешение 480p (480×640), 360p (360×480), 240p (240×320) и даже 144p (144×256).

144p-4320p

Этого конечно недостаточно для современных телевизоров и мониторов с их разрешением 1080p (1080×1920) и выше. Уже не первый год трендом является 4K (2160×3840), а через год-другой ожидаются массовые продажи телевизоров 8K (4320×7680). Собственно, первые телевизоры с таким разрешением поступили в продажу еще в 2015 (см. Sharp LV-85001 за $133 тысяч), а мониторы — в 2017 (Dell UltraSharp 32 Ultra HD 8K за $5 тысяч).

И здесь на помощь могут придти технологии вроде анонсированной недавно DLSS от Nvidia.  Как уже рассказывал Gadgets News, это метод сглаживания, альтернативный применявшемуся ранее TAA. В качестве сглаживания DLSS почти не уступает TAA, и при этом менее требователен к производительности. Меньшая требовательность обусловлена тем, что сначала графика генерируется на относительно низком разрешении, а потом апскейлится (масштабируется в более высокое разрешение) с прорисовкой новых, соседних, пикселей при помощи машинного обучения. Я надеюсь, что особых технических сложностей для применения аналогичной технологии в кино нет — проблема в отсутствии коммерческого интереса к такого рода контенту со стороны кинопрокатных компаний. Но если этим займутся энтузиасты, или даже качественная обработка будет производится автоматически, при загрузке контента в YouTube, то возможно со временем мы увидим немало старых кинофильмов в разрешении, вполне достойном современных телевизоров и мониторов.

Но кино — это не только изображение, это еще и звук. Проблема здесь не в его качестве, оно вполне сносное даже в очень старых экранизациях — речь идет о дублировании сотен зарубежных фильмов. Любители старого доброго итальянского, французского, английского, американского и прочего кино наверняка помнят, как прекрасно оно дублировалось на Союзмультфильме и других советских киностудиях. Многие из них после распада СССР были переозвучены (как правило довольно убого), но большинство старых версий все-таки сохранилось. А до некоторых замечательных зарубежных кинолент советский дубляж вообще не добрался. Например, к/ф «Мания величия» советским кинопрокатом не был приобретен (и соответственно озвучен) из-за участия в нем опального в СССР Ива Монтана. Поэтому Луи де Фюнес в российской кинопрокатной версии этого фильма голосом Кенигсона не говорит и, увы, не заговорит уже никогда. Или все-таки заговорит?

la-folie-des-grandeurs_hd

Здесь на ум вновь приходит искусственный интеллект. Ведь можно обучить нейросеть на базе ролей какого-нибудь артиста (того же Кенигсона), синхронизировав звуковую дорожку с субтитрами, и потом с её помощью синтезировать новые реплики, для дублирования новых ролей. Конечно для целей озвучивания кино искусственная речь должна быть абсолютно естественной и звучать именно так, как говорил бы этот артист в жизни. Вероятно пока это выше возможностей современных систем машинного обучения, но в перспективе, на которую я в очередной раз уповаю, это задача наверняка решаемая. Причем помимо кино, подобный прием можно использовать в аудио-книгах (где весь текст зачитывается одним голосом) и даже в аудио-спектаклях (где один голос читает текст от автора, а другие произносят реплики персонажей).

Если не принимать во внимание отсутствие серьезного коммерческого интереса к подобным проектам, с технической точки зрения нечто подобное станет возможным вероятно уже в ближайшие годы, с той или степенью естественности произношения. Как скоро качество искусственной речи станет неотличимым от подлинника, сказать сложнее — в принципе на это могут уйти целые десятилетия. Но когда это случится, в индустрии развлечений произойдет настоящая революция. Новые роли в кино и компьютерных играх можно будет озвучивать голосами давно умерших артистов или, скажем, политиков (чтобы, например, Сталин в кино говорил именно голосом Сталина, а не его имитаторов). Также удастся значительно сократить усилия (да и расходы тоже) на озвучивание ролей современными артистами — достаточно будет им заплатить за право использования их голоса, после чего просто обучить нейросеть на записях.

Еще интереснее представляется перспектива создания искусственных голосов, наложения голосов посредственных исполнителей на артикуляцию и интонацию, с которой говорит какой-нибудь гениальный артист и т.д. и т.п. Причем с учетом практически неограниченных ресурсов для обучения искусственных голосов, их актерские качества обещают превзойти множество посредственных актеров, занятых в современных кино и телесериалах.

Поскольку уже сейчас компьютерная графика позволяет воспроизвести лицо и мимику любого человека, в сочетании с технологиями синтезирования речи персонажи кино со временем, похоже, станут полностью искусственными. В 2002 году, когда на экраны вышел к/ф «Симона», это казалось совершенной фантастикой — но сегодня куда ближе к реальности. С учетом того, что гонорары именитых актеров за участие в одном фильме могут превышать сто миллионов долларов, подобные технологии кинорежиссеров определенно заинтересуют.

S1m0ne

Впрочем, к тому времени и режиссеры могут остаться без работы. Если принять во внимание литературные и музыкальные способности искусственного интеллекта (пока, конечно, совершенно зачаточные), то в будущем он сможет писать для кино сценарии и музыку. И тогда создание нового кинофильма возможно будет напоминать сцену из «Египетских ночей» Пушкина:

Итальянец умолк… Чарский молчал, изумленный и растроганный.
— Ну что? — спросил импровизатор. Чарский схватил его руку и сжал её крепко.
— Что? — спросил импровизатор, — каково?
— Удивительно, — отвечал поэт. — Как! Чужая мысль чуть коснулась вашего слуха и уже стала вашею собственностью, как будто вы с нею носились, лелеяли, развивали её беспрестанно. Итак, для вас не существует ни труда, ни охлаждения, ни этого беспокойства, которое предшествует вдохновению?.. Удивительно, удивительно!..

Подобная импровизация способна сделать будущий кинематограф новым жанром искусства. В наше время кинофильм снимают раз и навсегда, в лучшем (или худшем, смотря что получится) случае его повторяют т.н. ремейками. А искусственный интеллект-импровизатор чужую мысль сможет выразить множеством разных способов, меняя сюжет, внешность и голоса персонажей, музыку и т.д. Таким образом, каждый единичный показ такого кинофильма может оказаться премьерой.

Как еще можно использовать искусственный интеллект в кино? Я бы выделил два таких направления, как рекомендация и поиск. В первом случае речь идет об анализе предпочтений зрителя (на основе просмотренных им кинофильмов, прочитанных книг и статей, поисковых запросов), и формирование на их основе подборки кинофильмов, которые его заинтересуют. Аналогичные технологии существуют уже сегодня, но со временем они будут совершенствоваться и вырабатывать более релевантные рекомендации. Ведь одно дело выявить интерес зрителя к определенному жанру или актеру, а другое — распознать уровень его интеллектуальных и культурных предпочтений, интерес к определенным сюжетным линиям и т.д. А когда искусственный интеллект научится до мельчайших подробностей распознавать и описывать сюжет «просмотренного» им видео, он, соответственно, сможет и находить этот сюжет по заданному в поиске эпизоду.

Словом, у искусственного интеллекта в кино имеется масса возможных применений, от вполне реального уже сегодня увеличения разрешения видео до пока еще фантастического создания искусственным интеллектом кинофильмов без привлечения людей к этому процессу.