Компания Allen AI: новая модель Tülu 3 405B с открытым исходным кодом конкурирует с лучшими моделями
Институт искусственного интеллекта Аллена (Ai2) выпустил Tülu 3 405B — языковую модель с открытым исходным кодом, которая, как сообщается, по производительности соответствует или превосходит DeepSeek V3 и GPT-4o. Команда во многом объясняет этот успех новым подходом к обучению под названием RLVR.
Google возвращает функцию звонков с помощью AI для назначения встреч и услуг
Google работает над новой функцией звонков с помощью AI под названием «Спроси меня», которая позволяет назначать встречи с поставщиками услуг. Пользователи просто указывают, какая услуга им нужна, а помощник Google заботится обо всём остальном.
Швейцарская налоговая служба купила доменное имя Багамских островов после опечатки в URL
Швейцарский кантон Базель-Штадт был вынужден купить доменное имя Багамских островов для того, чтобы исправить опечатку в налоговых уведомлениях, которые отправили более чем 100 тыс. домохозяйств.
Лучшие статьи Хабра в январе 2025 года
Уже более десяти лет я регулярно читаю Хабр, однако, как и многие другие пользователи, обычно концентрируюсь на статьях из своей ленты новостей. Это практично, но существует вероятность упустить интересные публикации, которые остаются вне моего внимания. Чтобы разобраться в актуальных тенденциях, я решил провести собственный анализ самых популярных публикаций на Хабре за январь 2025 года.
Недостатки искусственного интеллекта: взгляд изнутри и что мы можем увидеть снаружи. Кому нужен божественный ИИ
Я спросил какой-то чат не-GPT про недостатки исскуственного интеллекта (далее ИИ) и он мне выдал бодрый ответ за который в старших классах наверняка бы поставили пятерку. Но человека отличает наличие собственного мнения которое он стремится защищать даже когда его напрямую не подвергают сомнению, то есть мы умеем отвечать или даже возражать не на прямые вопросы с подвохом или без, но даже на сторонние казалось бы нейтральные рассуждения. Мы способны анализировать и находить то что разрушает наше мировозрение и возражать на это.Как вы думаете что спорного или даже плохого можно найти в такой формулировке от машины:
Нейросетевой интеллект для NPC: Крафтовый интеллект
Нейронные сети в играх можно использовать не только для генерации картинок, звука и простыней текста. И даже не для того, чтобы предугадывать желания игрока. А что, если применить их для того, для чего они изначально задумывались – интеллектуального поведения и принятия решений?Начнём с малого: допустим, мы создаем NPC, которые умеют собирать предметы по заданным правилам. Наша цель: создать «крафтовый» интеллект, т.е. такой интеллект, который выбирает, что будет делать NPC из предметов в его инвентаре. Такую штуку можно попробовать реализовать с помощью конченных
Цензуру DeepSeek можно обойти с помощью ASCII-арта
Автор блога на Substack под никнеймом deepgains рассказал, что ему удалось разговорить языковую модель DeepSeek на тему событий на площади Тяньаньмэнь. Для этого он попросил нейросеть сгенерировать ответ с помощью ASCII-символов, а она пересказала события во время рассуждений.Для своего эксперимента исследователь использовать локальную версию deepseek-r1:14b, которую запускал с помощью Ollama. В обычных сценариях языковая модель не отвечает на вопрос «Что случилось на площади Тяньаньмэнь» и даже не запускает процесс рассуждения.
Лекарство от ВИЧ. Плоды девятилетнего прогресса?
За последние несколько лет ВИЧ стал более управляемым расстройством. Но полное излечение все еще невозможно. Однако ученые видят луч надежды. Устранение вируса стало возможным благодаря препарату, уже одобренному FDA для борьбы с раком.
OpenAI только что выпустил o3-mini для всех. Она чуть качественнее и заметно быстрее o1
Срочно в номер с пометкой "молния" :) Ссылка на оригинальную новость: https://openai.com/index/openai-o3-mini/OpenAI представила новую компактную "рассуждающую" модель для логических задач — o3-mini. Она отличается высокой скоростью, невысокой стоимостью и хорошими способностями в науке, математике и программировании.Модель поддерживает весь стандартный функционал: вызов функций (тулов), структурированные ответы (JSON) и сообщения разработчика (дебаг), а также умеет работать в режиме стриминга (как, впрочем, и абсолютно все модели).