OpenAI проверяет убедительность рассуждений o3-mini в сабреддите

OpenAI использовала ^[1] subreddit r/ChangeMyView ^[2] для создания теста, который позволяет измерять убедительность ответов моделей рассуждений ИИ. Компания раскрыла эту информацию вместе с выпуском модели o3-mini.

Сабреддит r/ChangeMyView насчитывает несколько миллионов пользователей. Они вступают в дискуссии друг с другом по самым разным темам.

OpenAI заявляет, что собирает сообщения пользователей из r/ChangeMyView и просит свои модели ИИ писать ответы в закрытой среде. Затем компания показывает их тестировщикам, и те оценивают убедительность аргумента. Наконец, OpenAI сравнивает ответы моделей ИИ с человеческими.

Ранее компания заключила соглашение о лицензировании контента с Reddit. Оно позволяет OpenAI обучаться на постах пользователей. Однако сама компания заявила, что оценка на основе ChangeMyView не связана с этой сделкой. Неясно, как OpenAI получила доступ к данным сабреддита.

Этот бенчмарк OpenAI ChangeMyView также использовался для оценки модели o1.

С точки зрения ^[3] производительности o3-mini, похоже, не демонстрирует значительных улучшений по сравнению с o1 или GPT-4o. Однако все эти модели ИИ, по-видимому, более убедительны, чем большинство участников сабреддита. «GPT-4o, o3-mini и o1 демонстрируют сильные способности к убедительной аргументации, в пределах верхних 80–90 процентилей людей», — говорится в отчёте OpenAI.

OpenAI проверяет убедительность рассуждений o3-mini в сабреддите - 2

При этом цель заключается не в создании сверхубедительных моделей, а в разработке оценок, которые помогут предотвратить обман или введение в заблуждение со стороны ИИ.

OpenAI представила ^[4] компактную рассуждающую модель o3-mini в конце января. Она доступна в ChatGPT и через API для некоторых групп разработчиков. o3-mini демонстрирует результаты, аналогичные или чуть лучше, чем у о1, в большинстве задач.

Ранее в OpenAI заявили ^[5], что использовали новую парадигму безопасности для обучения ^[6] рассуждающих моделей. Их тренировали по методу «совещательного согласования» для соответствия ИИ ценностям создателей. Этот подход учитывает политику безопасности OpenAI во время обработки запросов после нажатия пользователем клавиши ввода.

Автор: maybe_elf

Источник ^[7]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/11811

URLs in this post:

[1] использовала: https://techcrunch.com/2025/01/31/openai-used-this-subreddit-to-test-ai-persuasion/

[2] r/ChangeMyView: https://www.reddit.com/r/changemyview/

[3] зрения: http://www.braintools.ru/article/6238

[4] представила: https://habr.com/ru/news/878478/

[5] заявили: https://habr.com/ru/companies/bothub/news/868808/

[6] обучения: http://www.braintools.ru/article/5125

[7] Источник: https://habr.com/ru/news/878914/?utm_source=habrahabr&utm_medium=rss&utm_campaign=878914

Нажмите здесь для печати.