- BrainTools - https://www.braintools.ru -

Дым, отражения и порталы: Adobe TransPixar выводит AI VFX на новый уровень

Команда из Adobe Research [1] и Гонконгского университета науки и технологий [2] разработала систему искусственного интеллекта [3], которая может изменить подход к созданию визуальных эффектов для фильмов, игр и интерактивных медиа.

Дым, отражения и порталы: Adobe TransPixar выводит AI VFX на новый уровень - 1

Технология под названием TransPixar [4] добавляет в видео, созданные искусственным интеллектом, важную функцию: возможность создавать прозрачные элементы, такие как дым, отражения и эфемерные эффекты, которые естественным образом вписываются в сцены. Современные инструменты для создания видео с помощью AI обычно могут генерировать только цельные изображения, что является значительным техническим достижением.

“Альфа-каналы имеют решающее значение для создания визуальных эффектов, позволяя прозрачным элементам, таким как дым и отражения, плавно вписываться в сцены”, – сказал Ицзюнь Ли, руководитель проекта Adobe Research и один из авторов статьи [5]. “Однако создание видео RGBA, которое включает альфа-каналы для прозрачности, остается сложной задачей из-за ограниченных наборов данных и сложности адаптации существующих моделей”.

Этот прорыв произошёл в критический момент, когда спрос на визуальные эффекты продолжает расти в индустрии развлечений, рекламы и игр. Традиционная работа с визуальными эффектами часто требует от художников кропотливой ручной работы для создания убедительных прозрачных эффектов.

Основная способность TransPixar – сохранять высокое качество при работе с очень ограниченными обучающими данными. Исследователи добились этого, разработав новый подход, который расширяет существующие модели искусственного интеллекта для видео, а не создаёт их с нуля.

«Мы вводим новые токены для генерации альфа-канала, повторно инициализируем их позиционные вложения и добавляем вложения с нулевой инициализацией, чтобы отличать их от токенов RGB, — объяснил Луочжоу Ван, ведущий автор и исследователь из HKUST. — Используя схему тонкой настройки на основе LoRA, мы проецируем альфа-токены в пространство qkv, сохраняя качество RGB».

На демонстрациях система показала впечатляющие результаты, создавая разнообразные эффекты на основе простых текстовых подсказок — от вихрящихся грозовых туч и волшебных порталов до разбивающегося стекла и клубящегося дыма. Технология также может анимировать неподвижные изображения с эффектом прозрачности, открывая новые творческие возможности для художников и дизайнеров.

Исследовательская группа сделала свой код общедоступным на GitHub [6] и запустила демонстрационную версию на Hugging Face [7], чтобы разработчики и исследователи могли экспериментировать с этой технологией.

Предварительное тестирование показывает, что TransPixar может ускорить и упростить создание визуальных эффектов, особенно для небольших студий, которые не могут позволить себе дорогостоящие работы по созданию эффектов. Хотя для обработки длинных видео система по-прежнему требует значительных вычислительных мощностей, её потенциальное влияние на креативную индустрию очевидно.

Эта технология важна не только с точки зрения [8] технических усовершенствований. По мере того, как стриминговым сервисам требуется всё больше контента, а виртуальное производство растёт, прозрачные эффекты, создаваемые искусственным интеллектом, могут изменить работу студий. Небольшие команды могут создавать эффекты, для которых раньше требовались крупные студии, а более крупные производства могут завершать проекты гораздо быстрее.

TransPixar может быть особенно полезен для использования в режиме реального времени. Видеоигры, приложения дополненной реальности и прямые трансляции могут мгновенно создавать прозрачные эффекты, для чего сегодня требуются часы или дни работы.

Индустрия развлечений сталкивается с тремя растущими проблемами: зрители хотят больше контента [9]бюджеты ограничены [10], а художников-постановщиков не хватает [11]. Вопрос не в том, изменит ли AI визуальные эффекты, а в том, будут ли вообще существовать традиционные рабочие процессы VFX через пять лет.

Источник [12]

Автор: mefdayy

Источник [13]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/11118

URLs in this post:

[1] Adobe Research: https://research.adobe.com/

[2] Гонконгского университета науки и технологий: https://hkust.edu.hk/

[3] интеллекта: http://www.braintools.ru/article/7605

[4] TransPixar: https://wileewang.github.io/TransPixar/

[5] авторов статьи: https://wileewang.github.io/TransPixar/paper/paper.pdf

[6] общедоступным на GitHub: https://github.com/wileewang/TransPixar

[7] демонстрационную версию на Hugging Face: https://huggingface.co/spaces/wileewang/TransPixar

[8] зрения: http://www.braintools.ru/article/6238

[9] хотят больше контента: https://newsroom.ucla.edu/stories/hollywood-diversity-report-viewers-want-new-shows-diverse-stories

[10] бюджеты ограничены: https://sherwood.news/culture/netflix-spending-less-on-content/

[11] художников-постановщиков не хватает: https://www.linkedin.com/pulse/crisis-ignored-why-vfx-professionals-more-than-just-workers-sardesai-ozcfc/

[12] Источник: https://venturebeat.com/ai/smoke-reflections-and-portals-adobes-transpixar-takes-ai-vfx-to-the-next-level/

[13] Источник: https://habr.com/ru/companies/bothub/news/872286/?utm_source=habrahabr&utm_medium=rss&utm_campaign=872286

www.BrainTools.ru

Рейтинг@Mail.ru
Rambler's Top100