InfiniteYou от ByteDance позволяет пользователям создавать неограниченное количество вариаций портретных фотографий

Компания ByteDance разработала новый подход к созданию портретов с помощью ИИ, который решает такие распространенные проблемы, как непоследовательность черт лица и плохое следование подсказкам.

В отличие от предыдущих решений, таких как PuLID-FLUX, которые напрямую изменяют внимание ^[1] модели ИИ, InfuseNet обрабатывает черты лица как параллельный информационный слой. Это сохраняет основную модель ИИ нетронутой, одновременно улучшая качество генерации портретов.

Диаграмма: Архитектура InfuseNet для интеграции входных данных идентификации и управления в модели преобразования текста в изображение через остаточные соединения. — InfuseNet обрабатывает идентификационные характеристики и управляет входными данными отдельно от основной модели ИИ, что позволяет лучше сохранять черты лица при следовании текстовым подсказкам. | Изображение: ByteDance

Система использует двухэтапный процесс обучения ^[2]. Он начинается с реальных портретных фотографий, а затем переходит к синтетическим изображениям, которые генерируются системой с использованием специализированных модулей оптимизации.

По данным ByteDance, этот подход значительно улучшает качество вывода. Сгенерированные изображения сохраняют большее сходство с исходным человеком и точнее следуют текстовым подсказкам. Он также позволяет избежать распространенных проблем, таких как прямое копирование лица и ухудшение качества, которые мешают другим подходам.

В пользовательском тестировании с 16 участниками InfiniteYou показал явные преимущества по сравнению с существующими решениями. При оценке сходства лиц, точности текстовых подсказок, качества изображения и эстетики 72,8 процента предпочли результаты InfiniteYou по сравнению с 27,2 процента для PuLID-FLUX.

InfiniteYou работает с популярными инструментами ИИ, включая ControlNet и LoRA. Системе требуется всего четыре этапа обработки для генерации изображений, и она позволяет пользователям изменять как людей, так и объекты на них. Признавая эти улучшения, ByteDance отмечает, что все еще есть возможности для улучшения сходства лиц и качества изображений.

Диаграмма: InfiniteYou позволяет комбинировать входной идентификатор и стиль для создания настраиваемых выходных изображений. — Система интегрируется с существующими инструментами ИИ, такими как ControlNet и LoRA, что позволяет выполнять широкий спектр модификаций портретов и корректировок стиля. | Изображение: ByteDance

ByteDance опубликовал код InfiniteYou на GitHub ^[3] и сделал веса модели доступными через Hugging Face ^[4]. Экспериментальная демоверсия ^[5] запланирована, но пока не запущена.

Как участник Content Authenticity Initiative ^[6] , ByteDance работает с производителями камер и поставщиками медиа для внедрения метаданных C2PA для идентификации контента, сгенерированного ИИ. Однако компания не уточнила, будет ли InfiniteYou включать эти функции аутентификации.

Релиз следует за последними разработками ByteDance в области искусственного интеллекта ^[7], включая OmniHuman-1 ^[8] для фотореалистичной анимации и серию Goku ^[9] для видеороликов с искусственным интеллектом.

Источник ^[10]

Автор: dilnaz_04

Источник ^[11]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/13542

URLs in this post:

[1] внимание: http://www.braintools.ru/article/7595

[2] обучения: http://www.braintools.ru/article/5125

[3] GitHub: https://github.com/bytedance/InfiniteYou

[4] Hugging Face: https://huggingface.co/ByteDance/InfiniteYou

[5] демоверсия: https://huggingface.co/spaces/ByteDance/InfiniteYou-FLUX

[6] Content Authenticity Initiative: https://the-decoder.com/adobes-icon-of-transparency-reveals-ownership-and-production-details-of-ai-generated-content/

[7] интеллекта: http://www.braintools.ru/article/7605

[8] OmniHuman-1: https://the-decoder.com/bytedances-ai-can-animate-both-real-people-and-cartoon-characters-from-a-single-image/

[9] серию Goku: https://the-decoder.com/goku-models-from-bytedance-can-generate-realistic-product-videos-without-human-actors/

[10] Источник: https://the-decoder.com/bytedances-infiniteyou-lets-users-generate-unlimited-variations-of-portrait-photos/

[11] Источник: https://habr.com/ru/companies/bothub/news/894324/?utm_source=habrahabr&utm_medium=rss&utm_campaign=894324

Нажмите здесь для печати.