Google расширяет возможности помощника Gemini: анализ видео и демонстрация экрана. chatgpt.. chatgpt. google.. chatgpt. google. openai.. chatgpt. google. openai. анализ видео.. chatgpt. google. openai. анализ видео. Блог компании BotHub.. chatgpt. google. openai. анализ видео. Блог компании BotHub. демонстрация экрана.. chatgpt. google. openai. анализ видео. Блог компании BotHub. демонстрация экрана. ИИ.. chatgpt. google. openai. анализ видео. Блог компании BotHub. демонстрация экрана. ИИ. ии и машинное обучение.. chatgpt. google. openai. анализ видео. Блог компании BotHub. демонстрация экрана. ИИ. ии и машинное обучение. искусственный интеллект.. chatgpt. google. openai. анализ видео. Блог компании BotHub. демонстрация экрана. ИИ. ии и машинное обучение. искусственный интеллект. Машинное обучение.

Google интегрирует технологию анализа видео в реальном времени в своего помощника Gemini. Об этом компания сообщила на Mobile World Congress.

Google расширяет возможности помощника Gemini: анализ видео и демонстрация экрана - 1

Google представляет функции искусственного интеллекта для своего помощника Gemini на Всемирном мобильном конгрессе (MWC) в Барселоне. Компания объявила, что подписчики Google One AI Premium для Gemini Advanced получат доступ к функциям потокового видео и демонстрации экрана в конце этого месяца.

В Gemini Live появятся две новые важные функции: во-первых, возможность анализировать видео в реальном времени, а во-вторых, функция демонстрации экрана. С помощью обеих функций пользователи смогут делиться визуальным контентом с ИИ-помощником в режиме реального времени — в случае с видео в реальном времени через изображения с камеры, а в случае с демонстрацией экрана — через экран своего смартфона, чтобы получать комментарии к контенту.

Новые функции изначально доступны только на устройствах Android и поддерживают несколько языков. На MWC компания Google продемонстрирует интеграцию этих функций на устройствах-партнёрах от различных производителей Android.

Добавление визуальных функций — важный шаг в развитии ИИ-помощников, которые, как ожидается, будут всё чаще действовать мультимодально и взаимодействовать с реальным миром.

Цель Google на 2025 год — проект «Astra», универсальный мультимодальный ИИ-помощник, который может обрабатывать текстовые, видео- и аудиоданные в режиме реального времени и сохранять их в контексте диалога до десяти минут. Astra также сможет использовать Google Поиск, Lens и Карты.

Неизвестно, планирует ли Google на самом деле выпустить Astra или, что более вероятно, будут ли функции, представленные для Astra, интегрированы в Gemini.

С помощью Gemini Live Google позиционирует себя как конкурента OpenAI и его ChatGPT: с декабря в расширенном голосовом режиме ChatGPT появилась поддержка трансляции в реальном времени и демонстрации экрана.

Источник

Автор: mefdayy

Источник