- BrainTools - https://www.braintools.ru -
Я оптимизировал Trellis — мощный AI-инструмент для генерации 3D моделей из изображений, и хочу поделиться тем, как удалось снизить требования к видеопамяти с 16GB до 8GB, сохранив качество генерации.
Trellis — модель для генерации 3D-ассетов, разработанная Microsoft Research, способная создавать трёхмерные объекты из изображений. Её ключевая особенность — универсальный Structured LATent (SLAT) формат, за счет которого можно генерировать различные выходные форматы: от Radiance Fields и 3D Gaussians до полноценных мешей.
Но высокие требования к видеопамяти (минимум 16GB) существенно ограничивали доступность этого инструмента широкому кругу разработчиков и 3D-художников.
Основная идея моей оптимизации заключалась в переходе на более компактные форматы данных без существенной потери в качестве:
Замена 32-битных float на 16-битные (half-precision) в основном пайплайне
Использование 32-битных int вместо 64-битных в процессе SLAT-декодирования
Это позволило достичь цели — запуска на обычных видеокартах с 8GB памяти [1], что открывает возможности использования для владельцев RTX 3060 Ti, RTX 2070 и аналогичных карт.
Для Windows я подготовил простой установщик, не требующий дополнительных компонентов:
Не нужен CUDA Toolkit
Не требуется Visual Studio
Не нужны права администратора
Имеется встроенный Python 3.11 и все зависимости
Запуск осуществляется через bat-файлы:
run-gradio-fp16.bat
— веб-интерфейс в режиме half-precision, для работы через браузер
run-fp16.bat
— API-сервер в режиме half-precision для взаимодействия с программами такими как StableProjectorz
Оптимизированная версия Trellis может быть полезна для:
Исследователей и энтузиастов компьютерной графики
Разработчиков, изучающих возможности AI в создании 3D
Художников, экспериментирующих с новыми инструментами
Образовательных проектов в области 3D моделирования
Хотя основной код Trellis распространяется под MIT лицензией, некоторые используемые модули доступны только для исследовательских и оценочных целей. В настоящее время активно ведется работа по замене этих модулей на альтернативы с полностью коммерческой лицензией. Если у вас есть предложения по альтернативным решениям или вы хотите принять участие в разработке, можете заглянуть в код на гитхаб и предложить ваш pull-request.
Проект является частью исследования интеграции с StableProjectorz — инструментом для быстрого текстурирования 3D моделей через Stable Diffusion. Они хорошо дополняют друг друга в экспериментальном пайплайне создания 3D-контента. Сейчас он в состоянии бета-версии, и скоро будет полноценный релиз, для более надёжной работы с Треллис и другими генераторами, таким как Hunyuan3d.
StableProjectorz [3]
Discord: https://discord.gg/aWbnX2qan2 [4]
Автор: aherne
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/11530
URLs in this post:
[1] памяти: http://www.braintools.ru/article/4140
[2] Репозиторий с оптимизированной версией: https://github.com/IgorAherne/trellis-stable-projectorz/releases/tag/latest
[3] StableProjectorz: https://stableprojectorz.com/
[4] https://discord.gg/aWbnX2qan2: https://discord.gg/aWbnX2qan2
[5] Источник: https://habr.com/ru/articles/876636/?utm_source=habrahabr&utm_medium=rss&utm_campaign=876636
Нажмите здесь для печати.