- BrainTools - https://www.braintools.ru -
OpenAI использовала [1] subreddit r/ChangeMyView [2] для создания теста, который позволяет измерять убедительность ответов моделей рассуждений ИИ. Компания раскрыла эту информацию вместе с выпуском модели o3-mini.
Сабреддит r/ChangeMyView насчитывает несколько миллионов пользователей. Они вступают в дискуссии друг с другом по самым разным темам.
OpenAI заявляет, что собирает сообщения пользователей из r/ChangeMyView и просит свои модели ИИ писать ответы в закрытой среде. Затем компания показывает их тестировщикам, и те оценивают убедительность аргумента. Наконец, OpenAI сравнивает ответы моделей ИИ с человеческими.
Ранее компания заключила соглашение о лицензировании контента с Reddit. Оно позволяет OpenAI обучаться на постах пользователей. Однако сама компания заявила, что оценка на основе ChangeMyView не связана с этой сделкой. Неясно, как OpenAI получила доступ к данным сабреддита.
Этот бенчмарк OpenAI ChangeMyView также использовался для оценки модели o1.
С точки зрения [3] производительности o3-mini, похоже, не демонстрирует значительных улучшений по сравнению с o1 или GPT-4o. Однако все эти модели ИИ, по-видимому, более убедительны, чем большинство участников сабреддита. «GPT-4o, o3-mini и o1 демонстрируют сильные способности к убедительной аргументации, в пределах верхних 80–90 процентилей людей», — говорится в отчёте OpenAI.
При этом цель заключается не в создании сверхубедительных моделей, а в разработке оценок, которые помогут предотвратить обман или введение в заблуждение со стороны ИИ.
OpenAI представила [4] компактную рассуждающую модель o3-mini в конце января. Она доступна в ChatGPT и через API для некоторых групп разработчиков. o3-mini демонстрирует результаты, аналогичные или чуть лучше, чем у о1, в большинстве задач.
Ранее в OpenAI заявили [5], что использовали новую парадигму безопасности для обучения [6] рассуждающих моделей. Их тренировали по методу «совещательного согласования» для соответствия ИИ ценностям создателей. Этот подход учитывает политику безопасности OpenAI во время обработки запросов после нажатия пользователем клавиши ввода.
Автор: maybe_elf
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/11811
URLs in this post:
[1] использовала: https://techcrunch.com/2025/01/31/openai-used-this-subreddit-to-test-ai-persuasion/
[2] r/ChangeMyView: https://www.reddit.com/r/changemyview/
[3] зрения: http://www.braintools.ru/article/6238
[4] представила: https://habr.com/ru/news/878478/
[5] заявили: https://habr.com/ru/companies/bothub/news/868808/
[6] обучения: http://www.braintools.ru/article/5125
[7] Источник: https://habr.com/ru/news/878914/?utm_source=habrahabr&utm_medium=rss&utm_campaign=878914
Нажмите здесь для печати.