БЯМ.

Чему может научить горилла Коко

4 июля 1971 года в зоопарке Сан-Франциско на свет появилась 50-я горилла, которая родилась в неволе. День рождения этой особи совпал с днём независимости США, который американцы отмечают запуском фейерверков. Поэтому обезьяну назвали Ханабико — «дитя фейерверков» по-японски. Мир знает эту удивительную гориллу под именем Коко.

продолжить чтение ......

Оставлено в

Как работают языковые модели

Руководство вообще без жаргона

продолжить чтение ......

Оставлено в

Google призналась, что демонстрация мультимодальности Gemini — это постановка

6 декабря вместе с семейством моделей Gemini компания Google показала видеоролик, где человек взаимодействует с мультимодальной языковой моделью. На видео пользователь общается голосом, рисует и показывает жесты, а Gemini распознаёт увиденное и всячески развлекает. Как заметили наблюдатели и как позже признала Google, видеоролик преувеличивает технические способности ИИ.

продолжить чтение ......

Оставлено в

Даже если случайно переставить буквы в словах, GPT-4 понимает текст

Цветом выделена токенизация Для представления внутри трансформеров слова или их небольшие части преобразуются в токены. Кажется, что если перемешать в каждом слове буквы, то языковая модель на трансформерах потеряет всякую способность понимать текст. Авторы научной работы «Unnatural Error Correction: GPT-4 Can Almost Perfectly Handle Unnatural Scrambled Text» (arXiv:2311.18805) показали, что это не так. Как выяснилось, GPT-4 без проблем оперирует текстом, где в каждом слове все буквы случайно переставлены.

продолжить чтение ......

Оставлено в

Ответ ChatGPT длиннее, если пообещать чаевые

@voooooogel Микроблогер поделилась забавным наблюдением про работу ChatGPT: языковая модель реагирует на обещание дать чаевые и отвечает чуть подробнее. Хотя чат-бот не имеет возможности получить оплату, размер ответа всё равно незначительно вырастает.

продолжить чтение ......

Оставлено в

Контекстное окно в 200 тыс. токенов Claude 2.1 подвергли проверке

Anthropic Компания Anthropic представила Claude 2.1, следующую версию своей языковой модели. В 2.1 заявлены разнообразные улучшения точности и 50-процентное сокращение частоты галлюцинаций. Новая модель удваивает размер контекстного окна со 100 тыс. токенов до 200 тыс. Грег Камрадт протестировал эффективность памяти Claude 2.1 в зависимости от длины контекста и выдал несколько рекомендаций.

продолжить чтение ......

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

БЯМ.

Чему может научить горилла Коко

Как работают языковые модели

Google призналась, что демонстрация мультимодальности Gemini — это постановка

Даже если случайно переставить буквы в словах, GPT-4 понимает текст

Ответ ChatGPT длиннее, если пообещать чаевые

Контекстное окно в 200 тыс. токенов Claude 2.1 подвергли проверке

Меню навигации

Рекомендуем

На главную

Главное

Рубрики

Методики

Информация

Из архивов

БЯМ.

Чему может научить горилла Коко

Как работают языковые модели

Google призналась, что демонстрация мультимодальности Gemini — это постановка

Даже если случайно переставить буквы в словах, GPT-4 понимает текст

Ответ ChatGPT длиннее, если пообещать чаевые

Контекстное окно в 200 тыс. токенов Claude 2.1 подвергли проверке