multimodal LLM.

Gemma3, новая опенсорсная модель от Google, уже доступна в Ollama

Модель Gemma 3 мультимодальная, то есть может обрабатывать текст и изображения, и имеет окно контекста размером 128 тысяч токенов с поддержкой более 140 языков.В Ollama она доступна в четырех вариантах с 1, 4, 12 и 27 миллиардами параметров и превосходно справляется с такими задачами, как ответы на вопросы, резюмирование и логическое мышление, в то время как их компактный дизайн позволяет развертывание на устройствах с ограниченными ресурсами.

продолжить чтение ......

Оставлено в

Google призналась, что демонстрация мультимодальности Gemini — это постановка

6 декабря вместе с семейством моделей Gemini компания Google показала видеоролик, где человек взаимодействует с мультимодальной языковой моделью. На видео пользователь общается голосом, рисует и показывает жесты, а Gemini распознаёт увиденное и всячески развлекает. Как заметили наблюдатели и как позже признала Google, видеоролик преувеличивает технические способности ИИ.

продолжить чтение ......

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

multimodal LLM.

Gemma3, новая опенсорсная модель от Google, уже доступна в Ollama

Google призналась, что демонстрация мультимодальности Gemini — это постановка

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

multimodal LLM.

Gemma3, новая опенсорсная модель от Google, уже доступна в Ollama

Google призналась, что демонстрация мультимодальности Gemini — это постановка