- BrainTools - https://www.braintools.ru -

Gemini 2.5 Pro возглавил все ИИ-бенчмарки: Google возвращает корону технологического лидера

Всем привет!
Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания [1]. В основном про AI, изменение процессов, тренды и продуктовое видение.

У себя в телеграм-канале [2] делюсь сжатыми и структурированными саммери статей.

Сегодняшний перевод — Google Is Winning on Every AI Front [3]

Google вернулся в гонку ИИ с триумфом: их Gemini 2.5 Pro возглавил все авторитетные рейтинги моделей и получил восторженные отзывы экспертов. Компания интегрирует лучший в мире ИИ в свои сервисы с миллиардной аудиторией, создавая преимущество, которое нельзя купить за деньги — экосистему, где искусственный интеллект [4] становится неотъемлемой частью повседневных инструментов.

Google создал не только лучшую модель, но и собственную цепочку поставок для ИИ-инфраструктуры: от TPU Ironwood до облачных сервисов. Эта вертикальная интеграция — тот же подход, который сделал Apple неуязвимой на рынке смартфонов (аппаратные спецификации TPU).


Источник

Artificial Analysis Intelligence Index
Источник

Скорость. Выдача токенов в секунду
Источник

Стоимость токенов
  • Затем есть Gemma 3 [44] — модель Google с открытым исходным кодом, конкурентоспособная с лучшими моделями с открытым исходным кодом [45], включая Llama 4 (слишком большую [46]) и DeepSeek-V3.

  • Swyx построил график [47], показывающий, что “Google владеет Парето-фронтиром” с Gemini 2.0/2.5 (как Pro, так и Flash) по двум наиболее важным показателям: производительность и стоимость. Более того, наиболее производительные модели Google остаются экономически эффективными, а наиболее экономичные модели остаются производительными. Google на данный момент просто издевается над конкуренцией; Gemini буквально вне графиков.

Источник

График ценообразования модели. Полный анализ на https://latent.space
  • LLM, лежащие в основе чатботов, таких как Gemini и ChatGPT, является главным преимуществом, но далеко не единственным. Google доминирует в других областях генеративного AI так же явно, как и в моделях на основе текста. Они объявили, что интегрируют другие AI-инструменты, которые у них есть, в Vertex AI [48]: Lyria [49] (музыка), Imagen 3 [50] (изображения), Veo 2 [51] (видео), и Chirp 3 [52] (голос/речь). Это, в некотором роде, побочные проекты для Google. Тем не менее, они мирового класса в своих категориях. Возможно, генерация изображений ChatGPT [53] лучше, но, например, Veo 2 заставил меня написать статью под названием “Вы должны увидеть, как далеко продвинулось AI-видео [54]“, в то время как OpenAI Sora – это чистая ерунда [55].

  • А что насчет агентов? Gemini 2.5 Pro в режиме Deep Research [56] в два раза лучше [57], чем Deep Research от OpenAI (до сих пор широко считавшийся самым важным AI-продуктом для исследовательской работы). Google DeepMind продолжает развивать Project Astra [58] (ассистент) и Project Mariner [59] (взаимодействие с компьютером).

Источник

Источник

Недавно писал Почему A2A может вытеснить MCP в мире AI-агентов? [63]

Источник

MCP — отличный протокол, который стремительно превращается в открытый стандарт эпохи агентных ИИ. Мы рады сообщить, что добавим его поддержку в наши модели Gemini и SDK. С нетерпением ждём возможности развивать MCP вместе с его командой и другими участниками отрасли.
  • Вдобавок ко всему, они продолжают выпускать высококачественные статьи для публикации в Nature [64] или представления на ICLR [65] или NeurIPS [66] или в других мировых журналах или конференциях. И если вдруг этого не происходит, вы в любом случае можете сказать, что они серьезно относятся как к усилиям по AGI [67], так и к промышленному AI [68].

Это всё? Не совсем. Давайте не будем забывать [69], что Google — компания по производству потребительского программного обеспечения в той же степени, что и AI-компания. Они создают лучшие модели, чем OpenAI и Anthropic, но они также делают много других вещей, которые никто другой делать не может.

  • OpenAI пытается войти [70] на рынки, где Google уже король. Возьмем поиск (одну из самых важных категорий программного обеспечения). Google и YouTube (№1 и №2 по общему поисковому трафику, оба под зонтиком Alphabet) получают комбинированную долю 50% от общего трафика в мире [71] (на рабочих столах). ChatGPT находится (похвально, хотя) на 6-м месте с 2,33%. Разве “ChatGPT не убил Google” 2 года назад? Сэм Альтман знает [72], что он пытается победить окончательного босса. (Кроме того, если у кого-то и есть массив данных, то это Google: YouTube, Search, Books, Photos и т.д.).

Источник

Источник
  • Но поиск — это лишь один из семи продуктов Google [73] с не менее чем двумя миллиардами активных пользователей в месяц (Search, YouTube, Android, Maps, Chrome, Gmail и Play Store). Я хвалю OpenAI за то, что они довели ChatGPT до 500 миллионов активных пользователей в неделю [74] (опять же, похвально), но они играют в разных лигах. Что происходит, когда Google добавляет Gemini к [75] своему [76] всему [77] набору [78] продуктов [79]? Внезапно миллиарды людей получают доступ по умолчанию к лучшему AI в мире бесплатно. И это не говоря уже о также чрезвычайно популярных облачных сервисах Workspace (Drive, Gmail, Docs, Sheets…).

  • Говоря об облачных вычислениях. Google, помимо того, что является AI-компанией и программной компанией, является гиперскейлером: Google Cloud арендует чипы [80] таким компаниям, как Anthropic, и сотрудничает с [81] компаниями, такими как Nvidia. OpenAI, между тем, зависит от Microsoft Azure [82], а Anthropic также зависит от Amazon AWS [83]. В то время как они оба щекочут ноги Google своими релизами AI, Google правой рукой борется с настоящими гигантами — Microsoft и Amazon — в облачном пространстве.

Инфографика: Amazon и Microsoft лидируют на глобальном облачном рынке | Statista

Инфографика: Amazon и Microsoft лидируют на глобальном облачном рынке | Statista
  • А левая рука? Подождите: AI, программное обеспечение, облако… Я что-то забываю. О, конечно, Google также является аппаратной компанией. Левой рукой Google борется с Nvidia на рынке AI-чипов (как для устранения своей бывшей зависимости от GPU, так и для продажи своих чипов другим компаниям [84]). Насколько хорошо у них дела? Они только что анонсировали 7-ю версию своего TPU, Ironwood [85]. Характеристики впечатляют [86]. Это чип, созданный для эпохи AI-инференса, как и Nvidia Blackwell. Но Nvidia занята борьбой с маленькими стартапами [87], которые стремятся захватить долю рынка на стороне инференса для AI-рабочих нагрузок, в то время как доходы Google защищены в других местах. А OpenAI… ну [88].

Источник

Источник

Я наверняка что-то упускаю, но думаю, что это достаточно побед для Google.

Когда я складываю картину Google + DeepMind вместе, я могу только удивляться, почему люди, включая меня, когда-либо стали такими оптимистичными относительно OpenAI или Anthropic или даже Meta.

Автор: Kual

Источник [98]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14405

URLs in this post:

[1] внимания: http://www.braintools.ru/article/7595

[2] телеграм-канале: https://t.me/+9rn-oYnaOAUzNDIy

[3] Google Is Winning on Every AI Front: https://www.thealgorithmicbridge.com/p/google-is-winning-on-every-ai-front?r=1kday&triedRedirect=true

[4] интеллект: http://www.braintools.ru/article/7605

[5] Gemini 2.5 Pro Experimental: https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#gemini-2-5-thinking

[6] LMArena: https://lmarena.ai/?leaderboard

[7] GPQA Diamond: https://x.com/EpochAIResearch/status/1907519991252992508

[8] Humanity’s Last Exam: https://scale.com/leaderboard/humanitys_last_exam

[9] Aider Polyglot: https://aider.chat/docs/leaderboards/

[10] Live Bench: https://livebench.ai/#/

[11] игре в Pokemon: https://m.twitch.tv/gemini_plays_pokemon

[12] Minecraft Bench: https://mcbench.ai/leaderboard

[13] примеры: https://x.com/wintermoat/status/1909787050640920894

[14] креативном письме: https://x.com/emollick/status/1904656593083396541

[15] понимании длинного контекста: https://fiction.live/stories/Fiction-liveBench-Mar-25-2025/oQdzQvKHw8JyXbN87

[16] вкусом: http://www.braintools.ru/article/6291

[17] люди: https://x.com/MatthewBerman/status/1904714953095078004

[18] массово: https://www.reddit.com/r/Bard/s/TTXsRTWJdA

[19] сообщают: https://x.com/emollick/status/1910208856480768283

[20] о том: https://artificialanalysis.ai/models/gemini-2-5-pro?models=o1%2Cgpt-4o%2Co3-mini-high%2Cllama-4-maverick%2Cgemini-2-5-pro%2Cclaude-35-sonnet%2Cclaude-3-7-sonnet%2Cdeepseek-r1%2Cgrok-beta#intelligence

[21] что: https://x.com/cgarciae88/status/1907457306947702925

[22] Gemini: https://www.reddit.com/r/ClaudeAI/s/30nIFOtVMP

[23] 2.5: https://www.reddit.com/r/GeminiAI/s/ihTsYvDxIY

[24] Pro: https://www.reddit.com/r/ClaudeAI/s/khkte9Bq49

[25] действительно: https://x.com/xf1280/status/1904587791868322036

[26] является: https://x.com/emollick/status/1909748270249001248

[27] лучшей: https://x.com/daniel_mac8/status/1910058485150269797

[28] моделью: https://x.com/petergyang/status/1906007718961492391

[29] на сегодняшний день: https://www.reddit.com/r/ChatGPTCoding/s/O3qJuHRsWA

[30] моделью: https://www.reddit.com/r/GeminiAI/s/aLDvqH12oq

[31] клип Matthew Berman: https://x.com/MatthewBerman/status/1904715099862098109

[32] быстрый: https://artificialanalysis.ai/models/gemini-2-5-pro?models=o1%2Cgpt-4o%2Co3-mini-high%2Cllama-4-maverick%2Cgemini-2-5-pro%2Cclaude-35-sonnet%2Cclaude-3-7-sonnet%2Cdeepseek-r1%2Cgrok-beta#speed

[33] дешевый: https://artificialanalysis.ai/models/gemini-2-5-pro?models=o1%2Cgpt-4o%2Co3-mini-high%2Cllama-4-maverick%2Cgemini-2-5-pro%2Cclaude-35-sonnet%2Cclaude-3-7-sonnet%2Cdeepseek-r1%2Cgrok-beta#pricing

[34] предоставляют бесплатный доступ: https://x.com/sundarpichai/status/1908173216499093625

[35] контекстное окно в 1 миллион токенов: https://artificialanalysis.ai/models/gemini-2-5-pro?models=o1%2Cgpt-4o%2Co3-mini-high%2Cllama-4-maverick%2Cgemini-2-5-pro%2Cclaude-35-sonnet%2Cclaude-3-7-sonnet%2Cdeepseek-r1%2Cgrok-beta#context-window

[36] скоро запускается: https://techcrunch.com/2025/04/09/googles-newest-gemini-ai-model-focuses-on-efficiency/

[37] 2.0: https://deepmind.google/technologies/gemini/flash/

[38] Lite: https://deepmind.google/technologies/gemini/flash-lite/

[39] Thinking: https://deepmind.google/technologies/gemini/flash-thinking/

[40] чрезвычайно быстрым: https://artificialanalysis.ai/models/gemini-2-0-flash#speed

[41] чрезвычайно дешевым: https://x.com/deedydas/status/1883355957838897409

[42] даже DeepSeek’s: https://artificialanalysis.ai/models/gemini-2-0-flash?models=gemini-2-0-flash%2Cdeepseek-r1%2Cdeepseek-v3&endpoints=#pricing

[43] своей дешевизной: https://x.com/EMostaque/status/1881310721746804810

[44] Gemma 3: https://blog.google/technology/developers/gemma-3/

[45] конкурентоспособная с лучшими моделями с открытым исходным кодом: https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf

[46] слишком большую: https://x.com/jeremyphoward/status/1908607345393098878

[47] Swyx построил график: https://x.com/swyx/status/1908215411214344669

[48] Vertex AI: https://cloud.google.com/blog/products/ai-machine-learning/expanding-generative-media-for-enterprise-on-vertex-ai

[49] Lyria: https://deepmind.google/discover/blog/transforming-the-future-of-music-creation/

[50] Imagen 3: https://deepmind.google/technologies/imagen-3/

[51] Veo 2: https://deepmind.google/technologies/veo/veo-2/

[52] Chirp 3: https://cloud.google.com/text-to-speech/docs/chirp3-hd

[53] генерация изображений ChatGPT: https://openai.com/index/introducing-4o-image-generation/

[54] Вы должны увидеть, как далеко продвинулось AI-видео: https://www.thealgorithmicbridge.com/p/you-must-see-how-far-ai-video-has

[55] OpenAI Sora – это чистая ерунда: https://www.thealgorithmicbridge.com/p/openai-sora-turbo-a-very-expensive

[56] Deep Research: https://x.com/demishassabis/status/1910143772635078754

[57] в два раза лучше: https://x.com/AdvaitOnline/status/1909721368259960957

[58] Project Astra: https://deepmind.google/technologies/project-astra/

[59] Project Mariner: https://deepmind.google/technologies/project-mariner/

[60] Agent2Agent: https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/

[61] Model Context Protocol: https://www.anthropic.com/news/model-context-protocol

[62] также будут строить: https://x.com/demishassabis/status/1910107859041271977

[63] Почему A2A может вытеснить MCP в мире AI-агентов?: https://habr.com/ru/articles/900498/

[64] публикации в Nature: https://www.nature.com/nature-index/institution-outputs/United%20Kingdom%20%28UK%29/Google%20DeepMind/54ee76b8140ba0f7058b4567

[65] ICLR: https://deepmind.google/discover/blog/google-deepmind-at-iclr-2024/

[66] NeurIPS: https://deepmind.google/discover/blog/google-deepmind-at-neurips-2024/

[67] усилиям по AGI: https://deepmind.google/discover/blog/taking-a-responsible-path-to-agi/

[68] промышленному AI: https://www.kaggle.com/whitepaper-prompt-engineering

[69] забывать: http://www.braintools.ru/article/333

[70] пытается войти: https://openai.com/index/introducing-chatgpt-search/

[71] долю 50% от общего трафика в мире: https://x.com/Similarweb/status/1888599585582370832

[72] Сэм Альтман знает: https://x.com/sama/status/1888703820596977684

[73] один из семи продуктов Google: https://www.washingtonpost.com/technology/2024/05/03/google-antitrust-monopoly-company-ownership-youtube/

[74] 500 миллионов активных пользователей в неделю: https://www.theinformation.com/articles/chatgpt-revenue-surges-30-just-three-months

[75] к: https://x.com/sundarpichai/status/1909456762723615052

[76] своему: https://blog.google/products/maps/gemini-google-maps-navigation-updates/

[77] всему: https://blog.google/products/android/android-gemini-google-ai/

[78] набору: https://support.google.com/mail/answer/14199860

[79] продуктов: https://chromewebstore.google.com/detail/gemini-for-chrome/aajjgdpofhhcjmjoombjdfepplndhgcp

[80] арендует чипы: https://www.anthropic.com/news/anthropic-partners-with-google-cloud

[81] сотрудничает с: https://x.com/googlecloud/status/1910006285069668495

[82] зависит от Microsoft Azure: https://blogs.microsoft.com/blog/2025/01/21/microsoft-and-openai-evolve-partnership-to-drive-the-next-phase-of-ai/

[83] зависит от Amazon AWS: https://www.anthropic.com/news/anthropic-amazon-trainium

[84] продажи своих чипов другим компаниям: https://techcrunch.com/2025/04/09/ilya-sutskever-taps-google-cloud-to-power-his-ai-startups-research/

[85] Ironwood: https://x.com/OfficialLoganK/status/1909992382046814458

[86] впечатляют: https://x.com/omarsar0/status/1909995966297469226

[87] борьбой с маленькими стартапами: https://www.theregister.com/2025/03/12/training_inference_shift/

[88] ну: https://www.reuters.com/technology/openai-set-finalize-first-custom-chip-design-this-year-2025-02-10/

[89] сражается: https://gs.statcounter.com/vendor-market-share/mobile

[90] Gemini уже на Pixel 9: https://arstechnica.com/gadgets/2024/08/pixel-9-phones-the-gemini-ai-stuff-reviewed/

[91] поделиться с ним экраном: https://www.theverge.com/news/644757/google-gemini-live-screen-share-video-camera-pixel-9

[92] попросить его взять на себя управление вашей камерой: https://blog.google/products/gemini/gemini-live-android-tips/

[93] является ли AI вапорвейром или нет: https://www.theverge.com/news/629940/apple-siri-robby-walker-delayed-ai-features

[94] выясняет: https://www.theinformation.com/articles/openai-discussed-buying-jony-ive-sam-altmans-ai-device-startup

[95] Другие: https://www.theverge.com/news/614883/humane-ai-hp-acquisition-pin-shutdown

[96] пытались: https://www.youtube.com/watch?v=ddTV12hErTc&ab_channel=MarquesBrownlee

[97] безуспешно: https://techcrunch.com/2025/01/20/friend-delays-shipments-of-its-ai-companion-pendant/

[98] Источник: https://habr.com/ru/articles/901720/?utm_source=habrahabr&utm_medium=rss&utm_campaign=901720

www.BrainTools.ru

Rambler's Top100