Google выпускает новую модель искусственного интеллекта, призванную обеспечить высокую производительность с упором на эффективность. Модель Gemini 2.5 Flash скоро будет запущена в Vertex AI, платформе разработки искусственного интеллекта Google. Компания заявляет, что предлагает «динамические и контролируемые» вычисления, позволяя разработчикам регулировать время обработки в зависимости от сложности запросов.

«Вы можете настроить скорость, точность и баланс затрат для ваших конкретных нужд», — написала Google в сообщении в блоге, предоставленном TechCrunch. «Эта гибкость является ключом к оптимизации производительности Flash в высокообъемных, чувствительных к затратам приложениях».
Gemini 2.5 Flash выходит на рынок, поскольку стоимость флагманских моделей AI продолжает расти. Более дешевые, производительные модели, такие как 2.5 Flash, представляют собой привлекательную альтернативу дорогостоящим топовым вариантам за счет некоторой потери точности.
Gemini 2.5 Flash — это «рассуждающая» модель по типу o3-mini от OpenAI и R1 от DeepSeek. Это означает, что для проверки фактов требуется немного больше времени, чтобы ответить на вопросы.
Google утверждает, что 2.5 Flash идеально подходит для приложений с большим объемом данных и работающих в режиме реального времени, таких как обслуживание клиентов и анализ документов.
«Эта рабочая модель оптимизирована специально для низкой задержки и снижения затрат», — говорится в сообщении Google в блоге. «Это идеальный движок для отзывчивых виртуальных помощников и инструментов резюмирования в реальном времени, где эффективность при масштабировании является ключевым фактором».
Google не опубликовала отчет по безопасности или техническим характеристикам для Gemini 2.5 Flash, что усложнило задачу определения преимуществ и недостатков модели. Ранее компания сообщила TechCrunch, что не публикует отчеты для моделей, которые она считает «экспериментальными».
Google также объявила в среду, что планирует вывести модели Gemini, такие как 2.5 Flash, на локальные среды, начиная с третьего квартала. Модели Gemini компании будут доступны в Google Distributed Cloud (GDC), локальном решении Google для клиентов со строгими требованиями к управлению данными. Google заявляет, что работает с Nvidia, чтобы вывести модели Gemini на совместимые с GDC системы Nvidia Blackwell, которые клиенты могут приобрести через Google или по своим предпочтительным каналам.
Автор: dilnaz_04