- BrainTools - https://www.braintools.ru -
Команда из Adobe Research [1] и Гонконгского университета науки и технологий [2] разработала систему искусственного интеллекта [3], которая может изменить подход к созданию визуальных эффектов для фильмов, игр и интерактивных медиа.
Технология под названием TransPixar [4] добавляет в видео, созданные искусственным интеллектом, важную функцию: возможность создавать прозрачные элементы, такие как дым, отражения и эфемерные эффекты, которые естественным образом вписываются в сцены. Современные инструменты для создания видео с помощью AI обычно могут генерировать только цельные изображения, что является значительным техническим достижением.
“Альфа-каналы имеют решающее значение для создания визуальных эффектов, позволяя прозрачным элементам, таким как дым и отражения, плавно вписываться в сцены”, – сказал Ицзюнь Ли, руководитель проекта Adobe Research и один из авторов статьи [5]. “Однако создание видео RGBA, которое включает альфа-каналы для прозрачности, остается сложной задачей из-за ограниченных наборов данных и сложности адаптации существующих моделей”.
Этот прорыв произошёл в критический момент, когда спрос на визуальные эффекты продолжает расти в индустрии развлечений, рекламы и игр. Традиционная работа с визуальными эффектами часто требует от художников кропотливой ручной работы для создания убедительных прозрачных эффектов.
Основная способность TransPixar – сохранять высокое качество при работе с очень ограниченными обучающими данными. Исследователи добились этого, разработав новый подход, который расширяет существующие модели искусственного интеллекта для видео, а не создаёт их с нуля.
«Мы вводим новые токены для генерации альфа-канала, повторно инициализируем их позиционные вложения и добавляем вложения с нулевой инициализацией, чтобы отличать их от токенов RGB, — объяснил Луочжоу Ван, ведущий автор и исследователь из HKUST. — Используя схему тонкой настройки на основе LoRA, мы проецируем альфа-токены в пространство qkv, сохраняя качество RGB».
На демонстрациях система показала впечатляющие результаты, создавая разнообразные эффекты на основе простых текстовых подсказок — от вихрящихся грозовых туч и волшебных порталов до разбивающегося стекла и клубящегося дыма. Технология также может анимировать неподвижные изображения с эффектом прозрачности, открывая новые творческие возможности для художников и дизайнеров.
Исследовательская группа сделала свой код общедоступным на GitHub [6] и запустила демонстрационную версию на Hugging Face [7], чтобы разработчики и исследователи могли экспериментировать с этой технологией.
Предварительное тестирование показывает, что TransPixar может ускорить и упростить создание визуальных эффектов, особенно для небольших студий, которые не могут позволить себе дорогостоящие работы по созданию эффектов. Хотя для обработки длинных видео система по-прежнему требует значительных вычислительных мощностей, её потенциальное влияние на креативную индустрию очевидно.
Эта технология важна не только с точки зрения [8] технических усовершенствований. По мере того, как стриминговым сервисам требуется всё больше контента, а виртуальное производство растёт, прозрачные эффекты, создаваемые искусственным интеллектом, могут изменить работу студий. Небольшие команды могут создавать эффекты, для которых раньше требовались крупные студии, а более крупные производства могут завершать проекты гораздо быстрее.
TransPixar может быть особенно полезен для использования в режиме реального времени. Видеоигры, приложения дополненной реальности и прямые трансляции могут мгновенно создавать прозрачные эффекты, для чего сегодня требуются часы или дни работы.
Индустрия развлечений сталкивается с тремя растущими проблемами: зрители хотят больше контента [9], бюджеты ограничены [10], а художников-постановщиков не хватает [11]. Вопрос не в том, изменит ли AI визуальные эффекты, а в том, будут ли вообще существовать традиционные рабочие процессы VFX через пять лет.
Источник [12]
Автор: mefdayy
Источник [13]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/11118
URLs in this post:
[1] Adobe Research: https://research.adobe.com/
[2] Гонконгского университета науки и технологий: https://hkust.edu.hk/
[3] интеллекта: http://www.braintools.ru/article/7605
[4] TransPixar: https://wileewang.github.io/TransPixar/
[5] авторов статьи: https://wileewang.github.io/TransPixar/paper/paper.pdf
[6] общедоступным на GitHub: https://github.com/wileewang/TransPixar
[7] демонстрационную версию на Hugging Face: https://huggingface.co/spaces/wileewang/TransPixar
[8] зрения: http://www.braintools.ru/article/6238
[9] хотят больше контента: https://newsroom.ucla.edu/stories/hollywood-diversity-report-viewers-want-new-shows-diverse-stories
[10] бюджеты ограничены: https://sherwood.news/culture/netflix-spending-less-on-content/
[11] художников-постановщиков не хватает: https://www.linkedin.com/pulse/crisis-ignored-why-vfx-professionals-more-than-just-workers-sardesai-ozcfc/
[12] Источник: https://venturebeat.com/ai/smoke-reflections-and-portals-adobes-transpixar-takes-ai-vfx-to-the-next-level/
[13] Источник: https://habr.com/ru/companies/bothub/news/872286/?utm_source=habrahabr&utm_medium=rss&utm_campaign=872286
Нажмите здесь для печати.