- BrainTools - https://www.braintools.ru -

Как сократить расходы на инференс LLM? Разберемся на вебинаре

Присоединяйтесь к вебинару [1] 22 августа в 16:00 мск. Особенно ждем ML- и MLOps-инженеров, Data Scientists и NLP-инженеров, CTO и менеджеров ML-проектов.

Поделимся опытом [2] команды «Актион», которая сократила расходы на GPU на 60% и увеличила пропускную способность в 36 раз благодаря решению Compressa на инфраструктуре Selectel. 

Участникам дадим бесплатный двухнедельный тест LLM-платформы Compressa на инфраструктуре Selectel с GPU.

Зарегистрироваться → [1]

Программа

  • Проблемы внешних API и open-source моделей «из коробки»

  • Способы оптимизации LLM-моделей на своем сервере

  • Сравнение производительности и стоимости токенов после оптимизации LLM

  • Инфраструктура Selectel для инференса LLM моделей

  • Кейс «Актион» и Compressa. Оценка окупаемости решения и использование LLM в продакшене

  • Ответы на вопросы

Спикеры

  • Владислав Кирпинский, директор по облачной интеграции, Selectel

  • Алексей Гончаров, CEO и founder, MIL Team

  • Валентин Шишков, ML Product Manager, MIL Team

  • Владимир Хаванских, Chief Data Scientist, Актион

Принять участие → [1]

Автор: nastyakopi

Источник [3]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/10712

URLs in this post:

[1] к вебинару: https://slc.tl/i2i3d

[2] опытом: http://www.braintools.ru/article/6952

[3] Источник: https://habr.com/ru/companies/selectel/news/836224/?utm_source=habrahabr&utm_medium=rss&utm_campaign=836224

www.BrainTools.ru

Рейтинг@Mail.ru
Rambler's Top100