Cohere выпускает Embed 4: новая модель для работы с большими объёмами данных. cohere.. cohere. Embed 4.. cohere. Embed 4. rag.. cohere. Embed 4. rag. агенты ии.. cohere. Embed 4. rag. агенты ии. базы данных.. cohere. Embed 4. rag. агенты ии. базы данных. Блог компании BotHub.. cohere. Embed 4. rag. агенты ии. базы данных. Блог компании BotHub. ИИ.. cohere. Embed 4. rag. агенты ии. базы данных. Блог компании BotHub. ИИ. ии и машинное обучение.. cohere. Embed 4. rag. агенты ии. базы данных. Блог компании BotHub. ИИ. ии и машинное обучение. искусственный интеллект.. cohere. Embed 4. rag. агенты ии. базы данных. Блог компании BotHub. ИИ. ии и машинное обучение. искусственный интеллект. мультимодальность.

Расширенная генерация на основе поиска (RAG) по-прежнему является неотъемлемой частью современного увлечения агентским ИИ. Воспользовавшись сохраняющимся интересом к агентам, Cohere выпустила последнюю версию своей модели встраивания с более длинными контекстными окнами и большей мультимодальностью.

Cohere выпускает Embed 4: новая модель для работы с большими объёмами данных - 1

Cohere’s Embed 4 основан на мультимодальных обновлениях Embed 3 и добавляет больше возможностей для работы с неструктурированными данными. Благодаря контекстному окну на 128 000 токенов организации могут создавать вложения для документов объемом около 200 страниц.

«Существующие встраиваемые модели не способны изначально понимать сложные мультимодальные бизнес-материалы, из-за чего компаниям приходится разрабатывать громоздкие конвейеры предварительной обработки данных, которые лишь незначительно повышают точность, — написал Кохере в своём блоге. — Embed 4 решает эту проблему, позволяя предприятиям и их сотрудникам эффективно находить идеи, скрытые в горах информации, которую невозможно найти с помощью поиска».

Предприятия могут развернуть Embed 4 в частных виртуальных облаках или локальных технологических стеках для дополнительной защиты данных.

Компании могут генерировать вложения для преобразования своих документов или других данных в числовые представления для обычных случаев. Затем агенты могут ссылаться на эти вложения, чтобы отвечать на запросы.

По словам компании, Embed 4 «превосходит конкурентов в регулируемых отраслях», таких как финансы, здравоохранение и производство. Компания Cohere, которая в основном специализируется на корпоративных сценариях использования ИИ, заявила, что её модели учитывают потребности в безопасности регулируемых отраслей и хорошо понимают бизнес.

Компания обучила Embed 4 «устойчивости к помехам в реальных данных», чтобы он оставался точным, несмотря на «несовершенства» корпоративных данных, такие как орфографические ошибки и проблемы с форматированием.

«Он также эффективен при поиске по отсканированным документам и рукописным текстам. Эти форматы распространены в юридических документах, страховых счетах и чеках на расходы. Эта функция устраняет необходимость в сложной подготовке данных или предварительной обработке, экономя время и операционные расходы компаний», — сказал Кохере.

Организации могут использовать Embed 4 для презентаций инвесторам, составления отчётов о проверке, отчётов о клинических испытаниях, руководств по ремонту и документации по продуктам. ‭

Модель поддерживает более 100 языков, как и предыдущая версия модели.

Cohere выпускает Embed 4: новая модель для работы с большими объёмами данных - 2

Компания Agora, клиент Cohere, использовала Embed 4 для своей поисковой системы на основе ИИ и обнаружила, что модель может находить подходящие товары.

«Данные в сфере электронной коммерции сложны, они содержат изображения и многогранные текстовые описания. Возможность представлять наши товары в едином формате делает поиск быстрее, а внутренние инструменты — эффективнее», — написал в блоге Парам Джагги, основатель Agora.

Cohere утверждает, что такие модели, как Embed 4, улучшат сценарии использования агентов, и заявляет, что она может стать «оптимальной поисковой системой» для агентов и помощников с искусственным интеллектом на предприятии.

«Помимо высокой точности для разных типов данных, модель обеспечивает эффективность корпоративного уровня, — сказал Кохере. — Это позволяет масштабировать её для удовлетворения потребностей крупных организаций».

Кохере добавил, что Embed 4 создаёт сжатые вложения данных, чтобы сократить расходы на хранение.

Встраивания и поиск на основе RAG позволяют агенту ссылаться на конкретные документы для выполнения задач, связанных с запросом. Многие считают, что это обеспечивает более точные результаты, гарантируя, что агенты не будут отвечать неверными или вымышленными ответами.

Другие модели встраивания, с которыми конкурирует Cohere, включают Qodo-Embed-1-1.5B от Qodo и модели от Voyage AI, которые недавно приобрел поставщик баз данных MongoDB.

Источник

Автор: mefdayy

Источник

Рейтинг@Mail.ru
Rambler's Top100