- BrainTools - https://www.braintools.ru -

Pruna AI  создает свой фреймворк оптимизации открытым исходным кодом

Pruna AI [1], европейский стартап, работающий над алгоритмами сжатия для моделей искусственного интеллекта [2],  создает свой фреймворк оптимизации открытым исходным кодом. [3]

Pruna AI  создает свой фреймворк оптимизации открытым исходным кодом - 1

Pruna AI создает фреймворк, который применяет несколько методов повышения эффективности, таких как кэширование, прунинг, квантизация и дистилляция, к заданной модели AI.

«Мы также стандартизируем сохранение и загрузку сжатых моделей, применяем комбинации этих методов сжатия, а также оцениваем вашу сжатую модель после ее сжатия», — рассказал TechCrunch соучредитель и технический директор Pruna AI Джон Рачван.

В частности, фреймворк Pruna AI может оценить, происходит ли значительная потеря качества после сжатия модели, а также получаемый при этом прирост производительности.

«Если использовать метафору, мы похожи на то, как Hugging Face стандартизировала трансформаторы и диффузоры — как их вызывать, как их сохранять, загружать и т. д. Мы делаем то же самое, но для методов эффективности», — добавил он.

Крупные лаборатории AI уже используют различные методы сжатия. Например, OpenAI полагается на дистилляцию для создания более быстрых версий своих флагманских моделей.

Вероятно, именно так OpenAI разработала GPT-4 Turbo, более быструю версию GPT-4. Аналогично, модель генерации изображений Flux.1-schnell [4] является дистиллированной версией модели Flux.1 от Black Forest Labs.

Дистилляция — это метод, используемый для извлечения знаний из большой модели AI с моделью «учитель-ученик». Разработчики отправляют запросы модели учителя и записывают выходные данные. Иногда ответы сравниваются с набором данных, чтобы увидеть, насколько они точны. Затем эти выходные данные используются для обучения [5] модели ученика, которая обучается приближаться к поведению [6] учителя.

«Крупные компании обычно занимаются тем, что создают такие инструменты внутри компании. А то, что вы можете найти в мире открытого исходного кода, обычно основано на отдельных методах. Например, скажем, один метод квантования для LLM или один метод кэширования для диффузионных моделей», — сказал Рачван.

«Но вы не можете найти инструмент, который объединяет их все, делает их все простыми в использовании и объединяет вместе. И это большая ценность, которую Pruna приносит прямо сейчас».

Слева направо: Райан Найт Мази, Бертран Шарпантье, Джон Рахван, Стефан Гюннеманн

Слева направо: Райан Найт Мази, Бертран Шарпантье, Джон Рахван, Стефан Гюннеманн

Хотя Pruna AI поддерживает любые типы моделей, от больших языковых моделей до моделей диффузии, моделей преобразования речи в текст и моделей компьютерного зрения [7], в настоящее время компания уделяет больше внимания [8] моделям генерации изображений и видео.

Некоторые из существующих пользователей Pruna AI включают Scenario [9] и PhotoRoom [10]. В дополнение к версии с открытым исходным кодом, Pruna AI имеет корпоративное предложение с расширенными функциями оптимизации, включая агент оптимизации.

«Самой захватывающей функцией, которую мы скоро выпустим, станет компрессорный агент», — сказал Рачван. «По сути, вы даете ему свою модель, говорите: «Я хочу больше скорости, но не снижайте точность больше, чем на 2%». А затем агент просто сделает свое волшебство. Он найдет для вас лучшую комбинацию и вернет ее вам. Вам как разработчику ничего не нужно делать».

Pruna AI взимает почасовую плату за свою профессиональную версию. «Это похоже на то, как вы думаете о GPU, когда арендуете GPU на AWS или любом облачном сервисе», — сказал Рачван. И если ваша модель является критической частью вашей инфраструктуры AI, вы в конечном итоге сэкономите много денег на выводе с оптимизированной моделью. Например, Pruna AI уменьшила модель Llama в восемь раз без особых потерь, используя свой фреймворк сжатия. Pruna AI надеется, что ее клиенты будут рассматривать фреймворк сжатия как инвестицию, которая окупает себя.

Несколько месяцев назад Pruna AI привлекла $6,5 млн посевного финансирования. Среди инвесторов стартапа — EQT Ventures, Daphni, Motier Ventures и Kima Ventures.

Источник [11]

Автор: dilnaz_04

Источник [12]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/13335

URLs in this post:

[1] Pruna AI: https://www.pruna.ai/

[2] интеллекта: http://www.braintools.ru/article/7605

[3] создает свой фреймворк оптимизации открытым исходным кодом.: https://github.com/PrunaAI/pruna

[4] Flux.1-schnell: https://huggingface.co/black-forest-labs/FLUX.1-schnell

[5] обучения: http://www.braintools.ru/article/5125

[6] поведению: http://www.braintools.ru/article/9372

[7] зрения: http://www.braintools.ru/article/6238

[8] внимания: http://www.braintools.ru/article/7595

[9] Scenario: https://www.scenario.com/

[10] PhotoRoom: https://www.photoroom.com/

[11] Источник: https://techcrunch.com/2025/03/20/pruna-ai-open-sources-its-ai-model-optimization-framework/

[12] Источник: https://habr.com/ru/companies/bothub/news/892610/?utm_source=habrahabr&utm_medium=rss&utm_campaign=892610

www.BrainTools.ru

Рейтинг@Mail.ru
Rambler's Top100