ML-обработка видео в web-браузере для видеоконференций SaluteJazz
Нейросеть, сегментирующая изображение человека в кадре: как ускорить её в четыре раза? Привет, Хабр! Это Дмитрий Балиев из SberDevices. В этой статье, написанной по докладу с речь пойдёт о том, как мы обрабатываем алгоритмами видео в Web-браузерах для сервиса конференции SaluteJazz.Расскажу про контекст и ограничения, сам движок и особенности его реализации. Раскрою тайну, как мы работаем с графами вычислений, как инферим нейросети, и как затем всё это собираем, оптимизируем и тестируем. В конце — несколько полезных советов, как делать нейросети удобнее для встраивания.
Moonshot AI представляет Kimi-VL: мощную модель ИИ для обработки текста, изображений и видео
Новая модель ИИ с открытым исходным кодом от китайского стартапа Moonshot AI обрабатывает изображения, текст и видео с удивительной эффективностью. Модель Kimi-VL отличается способностью обрабатывать длинные документы, сложные рассуждения и понимать пользовательский интерфейс.
Всё как в жизни. Адаптация систем распознавания жестовых языков к реальным условиям
Всем привет! Ранее мы уже писали о том, как собрали самый большой и разнородный открытый датасет
Хакатон «Цифровой прорыв»: как команда валидации Альфа-Банка разработала решение для РЖД
Привет, Хабр! На связи команда «Чёрная уточка» из управления валидации Альфа-Банка (Светлана Хлыбова, Сергей Комаров, Буда Вампилов, Камиль Шакиров и Алексей Безручко). И сегодня мы расскажем о нашем первом (да ещё и вполне успешном) опыте участия в Дальневосточном федеральном окружном хакатоне проекта «Цифровой прорыв. Сезон: Искусственный интеллект. 2024». Нам приглянулся кейс от РЖД на тему компьютерного зрения, в котором было необходимо научить компьютер выявлять технологические нарушения по видеозаписям.