- BrainTools - https://www.braintools.ru -
Pruna AI [1], европейский стартап, работающий над алгоритмами сжатия для моделей искусственного интеллекта [2], создает свой фреймворк оптимизации открытым исходным кодом. [3]
Pruna AI создает фреймворк, который применяет несколько методов повышения эффективности, таких как кэширование, прунинг, квантизация и дистилляция, к заданной модели AI.
«Мы также стандартизируем сохранение и загрузку сжатых моделей, применяем комбинации этих методов сжатия, а также оцениваем вашу сжатую модель после ее сжатия», — рассказал TechCrunch соучредитель и технический директор Pruna AI Джон Рачван.
В частности, фреймворк Pruna AI может оценить, происходит ли значительная потеря качества после сжатия модели, а также получаемый при этом прирост производительности.
«Если использовать метафору, мы похожи на то, как Hugging Face стандартизировала трансформаторы и диффузоры — как их вызывать, как их сохранять, загружать и т. д. Мы делаем то же самое, но для методов эффективности», — добавил он.
Крупные лаборатории AI уже используют различные методы сжатия. Например, OpenAI полагается на дистилляцию для создания более быстрых версий своих флагманских моделей.
Вероятно, именно так OpenAI разработала GPT-4 Turbo, более быструю версию GPT-4. Аналогично, модель генерации изображений Flux.1-schnell [4] является дистиллированной версией модели Flux.1 от Black Forest Labs.
Дистилляция — это метод, используемый для извлечения знаний из большой модели AI с моделью «учитель-ученик». Разработчики отправляют запросы модели учителя и записывают выходные данные. Иногда ответы сравниваются с набором данных, чтобы увидеть, насколько они точны. Затем эти выходные данные используются для обучения [5] модели ученика, которая обучается приближаться к поведению [6] учителя.
«Крупные компании обычно занимаются тем, что создают такие инструменты внутри компании. А то, что вы можете найти в мире открытого исходного кода, обычно основано на отдельных методах. Например, скажем, один метод квантования для LLM или один метод кэширования для диффузионных моделей», — сказал Рачван.
«Но вы не можете найти инструмент, который объединяет их все, делает их все простыми в использовании и объединяет вместе. И это большая ценность, которую Pruna приносит прямо сейчас».
Хотя Pruna AI поддерживает любые типы моделей, от больших языковых моделей до моделей диффузии, моделей преобразования речи в текст и моделей компьютерного зрения [7], в настоящее время компания уделяет больше внимания [8] моделям генерации изображений и видео.
Некоторые из существующих пользователей Pruna AI включают Scenario [9] и PhotoRoom [10]. В дополнение к версии с открытым исходным кодом, Pruna AI имеет корпоративное предложение с расширенными функциями оптимизации, включая агент оптимизации.
«Самой захватывающей функцией, которую мы скоро выпустим, станет компрессорный агент», — сказал Рачван. «По сути, вы даете ему свою модель, говорите: «Я хочу больше скорости, но не снижайте точность больше, чем на 2%». А затем агент просто сделает свое волшебство. Он найдет для вас лучшую комбинацию и вернет ее вам. Вам как разработчику ничего не нужно делать».
Pruna AI взимает почасовую плату за свою профессиональную версию. «Это похоже на то, как вы думаете о GPU, когда арендуете GPU на AWS или любом облачном сервисе», — сказал Рачван. И если ваша модель является критической частью вашей инфраструктуры AI, вы в конечном итоге сэкономите много денег на выводе с оптимизированной моделью. Например, Pruna AI уменьшила модель Llama в восемь раз без особых потерь, используя свой фреймворк сжатия. Pruna AI надеется, что ее клиенты будут рассматривать фреймворк сжатия как инвестицию, которая окупает себя.
Несколько месяцев назад Pruna AI привлекла $6,5 млн посевного финансирования. Среди инвесторов стартапа — EQT Ventures, Daphni, Motier Ventures и Kima Ventures.
Источник [11]
Автор: dilnaz_04
Источник [12]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/13335
URLs in this post:
[1] Pruna AI: https://www.pruna.ai/
[2] интеллекта: http://www.braintools.ru/article/7605
[3] создает свой фреймворк оптимизации открытым исходным кодом.: https://github.com/PrunaAI/pruna
[4] Flux.1-schnell: https://huggingface.co/black-forest-labs/FLUX.1-schnell
[5] обучения: http://www.braintools.ru/article/5125
[6] поведению: http://www.braintools.ru/article/9372
[7] зрения: http://www.braintools.ru/article/6238
[8] внимания: http://www.braintools.ru/article/7595
[9] Scenario: https://www.scenario.com/
[10] PhotoRoom: https://www.photoroom.com/
[11] Источник: https://techcrunch.com/2025/03/20/pruna-ai-open-sources-its-ai-model-optimization-framework/
[12] Источник: https://habr.com/ru/companies/bothub/news/892610/?utm_source=habrahabr&utm_medium=rss&utm_campaign=892610
Нажмите здесь для печати.