Google DeepMind представил модель Gemini 2.5 Pro, которую компания называет своей самой мощной моделью ИИ на сегодняшний день.

По данным Google, новая модель уже значительно превосходит многие тестовые модели, в том числе Chatbot Arena, которая измеряет предпочтения людей.
Эта модель представляет собой первую крупную модель логического мышления Google после первых экспериментов с Flash 2.0 Thinking. Google намерен интегрировать эти возможности логического мышления во все свои будущие модели.
По словам Google, Gemini 2.5 Pro демонстрирует высокие возможности в различных областях. Без специальной оптимизации модель показывает хорошие результаты в математических и научных тестах, таких как GPQA и AIME. Она набрала 18,8% баллов в сложном тесте «Последний экзамен человечества» — это самый высокий результат среди моделей без дополнительных инструментов.
Что касается задач программирования, Google утверждает, что Gemini 2.5 Pro особенно хорошо справляется с разработкой веб-приложений и преобразованием кода. При индивидуальной настройке агента он достигает 63,8% на SWE-Bench Verified. Google демонстрирует эту возможность, показывая, как модель может генерировать функциональный игровой код на основе однострочной инструкции. Однако модель Claude 3.7 Sonnet Thinking от Anthropic по-прежнему превосходит модель Google в этом тесте.
Как и свои предшественники, Gemini 2.5 Pro обрабатывает текст, аудио, изображения, видео и код — разнообразие входных данных, с которым пока не могут сравниться конкурирующие модели. Модель поддерживает характерное для Google большое контекстное окно в 1 миллион токенов, которое планируется расширить до 2 миллионов.
Разработчики и компании уже могут экспериментировать с Gemini 2.5 Pro в Google AI Studio. Подписчики Gemini Advanced могут выбрать модель в раскрывающемся меню как на настольных компьютерах, так и на мобильных устройствах. В ближайшие недели Google планирует объявить о доступности в Vertex AI и ценах.
Автор: mefdayy