Новость о релизе появилась позавчера в соцсетях. Там же предлагается ознакомиться с таблицей с Livebench.ai:
Контекстное окно: 2М.
Можно пользоваться в AI Studio
и через АПИ: gemini-exp-1206
Я попробовал на своей задаче с которой сейчас упражняюсь (200тыс.токенов) — на первый взгляд показалось что работает в разы быстрее чем gemini-1.5-flash. Качество пока не оценивал.
UPDATE: Например, на задачах написания кода прогресс новой версии Gemini по сравнению с предыдущими по рейтингу Livebench выглядит так:
Собственно, это, на мой взгляд, и есть основная часть этой новости: Если раньше пользователи могли считать Gemini не самым оптимальным выбором для написания кода, то новая версия дает повод пересмотреть ранее сложившееся отношение.
В целом напомню в чем “профит” от использования Gemini:
-
Большое контекстное окно (input): 1 или 2 миллиона токенов, в зависимости от модели
-
Большой лимит бесплатного использования модели Flash: Миллион токенов в минуту, 1500 запросов в день.
Автор: AlexanderAnisimov