- BrainTools - https://www.braintools.ru -
Компания ByteDance разработала новый подход к созданию портретов с помощью ИИ, который решает такие распространенные проблемы, как непоследовательность черт лица и плохое следование подсказкам.
В отличие от предыдущих решений, таких как PuLID-FLUX, которые напрямую изменяют внимание [1] модели ИИ, InfuseNet обрабатывает черты лица как параллельный информационный слой. Это сохраняет основную модель ИИ нетронутой, одновременно улучшая качество генерации портретов.
Система использует двухэтапный процесс обучения [2]. Он начинается с реальных портретных фотографий, а затем переходит к синтетическим изображениям, которые генерируются системой с использованием специализированных модулей оптимизации.
По данным ByteDance, этот подход значительно улучшает качество вывода. Сгенерированные изображения сохраняют большее сходство с исходным человеком и точнее следуют текстовым подсказкам. Он также позволяет избежать распространенных проблем, таких как прямое копирование лица и ухудшение качества, которые мешают другим подходам.
В пользовательском тестировании с 16 участниками InfiniteYou показал явные преимущества по сравнению с существующими решениями. При оценке сходства лиц, точности текстовых подсказок, качества изображения и эстетики 72,8 процента предпочли результаты InfiniteYou по сравнению с 27,2 процента для PuLID-FLUX.
InfiniteYou работает с популярными инструментами ИИ, включая ControlNet и LoRA. Системе требуется всего четыре этапа обработки для генерации изображений, и она позволяет пользователям изменять как людей, так и объекты на них. Признавая эти улучшения, ByteDance отмечает, что все еще есть возможности для улучшения сходства лиц и качества изображений.
ByteDance опубликовал код InfiniteYou на GitHub [3] и сделал веса модели доступными через Hugging Face [4]. Экспериментальная демоверсия [5] запланирована, но пока не запущена.
Как участник Content Authenticity Initiative [6] , ByteDance работает с производителями камер и поставщиками медиа для внедрения метаданных C2PA для идентификации контента, сгенерированного ИИ. Однако компания не уточнила, будет ли InfiniteYou включать эти функции аутентификации.
Релиз следует за последними разработками ByteDance в области искусственного интеллекта [7], включая OmniHuman-1 [8] для фотореалистичной анимации и серию Goku [9] для видеороликов с искусственным интеллектом.
Источник [10]
Автор: dilnaz_04
Источник [11]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/13542
URLs in this post:
[1] внимание: http://www.braintools.ru/article/7595
[2] обучения: http://www.braintools.ru/article/5125
[3] GitHub: https://github.com/bytedance/InfiniteYou
[4] Hugging Face: https://huggingface.co/ByteDance/InfiniteYou
[5] демоверсия: https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX
[6] Content Authenticity Initiative: https://the-decoder.com/adobes-icon-of-transparency-reveals-ownership-and-production-details-of-ai-generated-content/
[7] интеллекта: http://www.braintools.ru/article/7605
[8] OmniHuman-1: https://the-decoder.com/bytedances-ai-can-animate-both-real-people-and-cartoon-characters-from-a-single-image/
[9] серию Goku: https://the-decoder.com/goku-models-from-bytedance-can-generate-realistic-product-videos-without-human-actors/
[10] Источник: https://the-decoder.com/bytedances-infiniteyou-lets-users-generate-unlimited-variations-of-portrait-photos/
[11] Источник: https://habr.com/ru/companies/bothub/news/894324/?utm_source=habrahabr&utm_medium=rss&utm_campaign=894324
Нажмите здесь для печати.