Skip to main content

Еще несколько лет назад, когда искусственный интеллект учили только генерировать тексты или выполнять другую рутинную задачу, многие пользователи считали, что творческие профессии от этого не пострадают, так как компьютер никогда не сможет нарисовать картинку или что-то в этом роде. На данный момент ситуация кардинально изменилась — DALLE-2 или Imagen могут генерировать очень реалистичные изображения статического содержания, не уступающие картинам великих художников. Более того, теперь пришло время развиваться дальше — NVIDIA создала модель, способную генерировать полноценные видеоролики, а не только статичные изображения.

NVIDIA создала нейронную сеть для генерации видео.  Она как ДАЛЛ-И 2, только для рекламы

Последняя модель от NVIDIA основана на архитектуре StyleGAN (генеративно-состязательная сеть, представленная NVIDIA в 2018 году), но с множеством дополнительных компонентов. В результате он позволяет генерировать видео — контент вполне адекватно демонстрирует движущиеся объекты в кадре, а также изменения «камерной» точки зрения и различные новые объекты и состояния, возникающие на видео с течением времени. Однако, чего и следовало ожидать, технология далека от идеала и работает рывками — даже на роликах, которые были отобраны разработчиками для демонстрации новой модели, можно заметить явные деформации фона и объектов при смене ракурса.

NVIDIA создала нейронную сеть для генерации видео.  Она как ДАЛЛ-И 2, только для рекламы

Также стоит отметить, что все видеоролики представлены в достаточно низком разрешении (128х128), поэтому говорить об их полноценном использовании пока рано. С другой стороны, авторы модели заявили, что базовая сеть StyleGAN-V просто повторяет один и тот же контент, тогда как новая модель способна генерировать декорации и объекты, которые появляются в кадре с течением времени. При этом системе удается поддерживать временную согласованность кадра, что теоретически в будущем позволит снимать целые фильмы только с помощью ИИ.

Оставить комментарий