Google запускает бюджетную версию Gemini 2.5 Flash в Vertex AI и готовит локальное развертывание моделей

Google выпускает новую модель искусственного интеллекта ^[1], призванную обеспечить высокую производительность с упором на эффективность. Модель Gemini 2.5 Flash скоро будет запущена в Vertex AI, платформе разработки искусственного интеллекта Google. Компания заявляет, что предлагает «динамические и контролируемые» вычисления, позволяя разработчикам регулировать время обработки в зависимости от сложности запросов.

«Вы можете настроить скорость, точность и баланс затрат для ваших конкретных нужд», — написала Google в сообщении в блоге, предоставленном TechCrunch. «Эта гибкость является ключом к оптимизации производительности Flash в высокообъемных, чувствительных к затратам приложениях».

Gemini 2.5 Flash выходит на рынок, поскольку стоимость флагманских моделей AI продолжает расти ^[2]. Более дешевые, производительные модели, такие как 2.5 Flash, представляют собой привлекательную альтернативу дорогостоящим топовым вариантам за счет некоторой потери точности.

Gemini 2.5 Flash — это «рассуждающая» модель по типу o3-mini от OpenAI и ^[3]R1 ^[4] от DeepSeek. Это означает, что для проверки фактов требуется немного больше времени, чтобы ответить на вопросы.

Google утверждает, что 2.5 Flash идеально подходит для приложений с большим объемом данных и работающих в режиме реального времени, таких как обслуживание клиентов и анализ документов.

«Эта рабочая модель оптимизирована специально для низкой задержки и снижения затрат», — говорится в сообщении Google в блоге. «Это идеальный движок для отзывчивых виртуальных помощников и инструментов резюмирования в реальном времени, где эффективность при масштабировании является ключевым фактором».

Google не опубликовала отчет по безопасности или техническим характеристикам для Gemini 2.5 Flash, что усложнило задачу определения преимуществ и недостатков модели. Ранее компания сообщила TechCrunch ^[5], что не публикует отчеты для моделей, которые она считает «экспериментальными».

Google также объявила в среду, что планирует вывести модели Gemini, такие как 2.5 Flash, на локальные среды, начиная с третьего квартала. Модели Gemini компании будут доступны в Google Distributed Cloud (GDC), локальном решении Google для клиентов со строгими требованиями к управлению данными. Google заявляет, что работает с Nvidia, чтобы вывести модели Gemini на совместимые с GDC системы Nvidia Blackwell, которые клиенты могут приобрести через Google или по своим предпочтительным каналам.

Источник ^[6]

Автор: dilnaz_04

Источник ^[7]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14065

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] расти: https://techcrunch.com/2025/04/04/gemini-2-5-pro-is-googles-most-expensive-ai-model-yet/

[3] o3-mini от OpenAI и : https://techcrunch.com/2025/01/31/openai-launches-o3-mini-its-latest-reasoning-model/

[4] R1: https://techcrunch.com/2025/01/27/deepseek-claims-its-reasoning-model-beats-openais-o1-on-certain-benchmarks/

[5] Ранее компания сообщила TechCrunch: https://techcrunch.com/2025/04/03/google-is-shipping-gemini-models-faster-than-its-ai-safety-reports/

[6] Источник: https://techcrunch.com/2025/04/09/googles-newest-gemini-ai-model-focuses-on-efficiency/

[7] Источник: https://habr.com/ru/companies/bothub/news/899228/?utm_source=habrahabr&utm_medium=rss&utm_campaign=899228

Нажмите здесь для печати.