- BrainTools - https://www.braintools.ru -
Google выпускает новую модель искусственного интеллекта [1], призванную обеспечить высокую производительность с упором на эффективность. Модель Gemini 2.5 Flash скоро будет запущена в Vertex AI, платформе разработки искусственного интеллекта Google. Компания заявляет, что предлагает «динамические и контролируемые» вычисления, позволяя разработчикам регулировать время обработки в зависимости от сложности запросов.
«Вы можете настроить скорость, точность и баланс затрат для ваших конкретных нужд», — написала Google в сообщении в блоге, предоставленном TechCrunch. «Эта гибкость является ключом к оптимизации производительности Flash в высокообъемных, чувствительных к затратам приложениях».
Gemini 2.5 Flash выходит на рынок, поскольку стоимость флагманских моделей AI продолжает расти [2]. Более дешевые, производительные модели, такие как 2.5 Flash, представляют собой привлекательную альтернативу дорогостоящим топовым вариантам за счет некоторой потери точности.
Gemini 2.5 Flash — это «рассуждающая» модель по типу o3-mini от OpenAI и [3]R1 [4] от DeepSeek. Это означает, что для проверки фактов требуется немного больше времени, чтобы ответить на вопросы.
Google утверждает, что 2.5 Flash идеально подходит для приложений с большим объемом данных и работающих в режиме реального времени, таких как обслуживание клиентов и анализ документов.
«Эта рабочая модель оптимизирована специально для низкой задержки и снижения затрат», — говорится в сообщении Google в блоге. «Это идеальный движок для отзывчивых виртуальных помощников и инструментов резюмирования в реальном времени, где эффективность при масштабировании является ключевым фактором».
Google не опубликовала отчет по безопасности или техническим характеристикам для Gemini 2.5 Flash, что усложнило задачу определения преимуществ и недостатков модели. Ранее компания сообщила TechCrunch [5], что не публикует отчеты для моделей, которые она считает «экспериментальными».
Google также объявила в среду, что планирует вывести модели Gemini, такие как 2.5 Flash, на локальные среды, начиная с третьего квартала. Модели Gemini компании будут доступны в Google Distributed Cloud (GDC), локальном решении Google для клиентов со строгими требованиями к управлению данными. Google заявляет, что работает с Nvidia, чтобы вывести модели Gemini на совместимые с GDC системы Nvidia Blackwell, которые клиенты могут приобрести через Google или по своим предпочтительным каналам.
Источник [6]
Автор: dilnaz_04
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/14065
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] расти: https://techcrunch.com/2025/04/04/gemini-2-5-pro-is-googles-most-expensive-ai-model-yet/
[3] o3-mini от OpenAI и : https://techcrunch.com/2025/01/31/openai-launches-o3-mini-its-latest-reasoning-model/
[4] R1: https://techcrunch.com/2025/01/27/deepseek-claims-its-reasoning-model-beats-openais-o1-on-certain-benchmarks/
[5] Ранее компания сообщила TechCrunch: https://techcrunch.com/2025/04/03/google-is-shipping-gemini-models-faster-than-its-ai-safety-reports/
[6] Источник: https://techcrunch.com/2025/04/09/googles-newest-gemini-ai-model-focuses-on-efficiency/
[7] Источник: https://habr.com/ru/companies/bothub/news/899228/?utm_source=habrahabr&utm_medium=rss&utm_campaign=899228
Нажмите здесь для печати.