DeepSeek R1.

Как обучить русскоязычную модель рассуждений — LRM?

Ранее на моем YouTube-канале уже были видео о моделях рассуждений — OpenAI o1/o3, DeepSeek R1. Эти модели обучены с помощью стратегии reinforcement learning находить решения для задач, требующих логических рассуждений. Способность строить цепочки рассуждений, ведущих к решению поставленной задачи, открывают возможность применения таких моделей в математике, программировании и других подобных направлениях.​

Сатья Наделла: DeepSeek — это новая планка для успеха ИИ Microsoft

Генеральный директор Microsoft Сатья Наделла прокомментировал успехи китайской DeepSeek R1 и отметил, что для работы его компании в области ИИ была установлена ​​новая планка.

Claude 3.7 Sonnet: Пора сдвинуть ChatGPT и Deepseek с лидирующих позиций

Последние месяцы рынок AI буквально кипит — одна за другой выходят мощные новинки. ChatGPT-4.5 от OpenAI, GROK-3 от X, свежие релизы от Google Gemini — и Anthropic не осталась в стороне, наконец представив свою свежую модель: Claude 3.7 Sonnet. Как заявляют разработчики, новая модель не просто стала быстрее и умнее своих предшественников, она буквально является гибридной моделью рассуждений. 

ChatGPT 4.5: бенчмарки, генерация художественных текстов и сравнение с DeepSeek-r1

В конце февраля OpenAI официально представила ChatGPT-4.5 — самую крупную и продвинутую модель для диалогового взаимодействия на сегодняшний день. 4.5

DeepSeek сообщил о «теоретической» марже в 545%

Китайский стартап в сфере искусственного интеллекта DeepSeek сообщил, что теоретическая доходность его моделей V3 и R1 достигает 545% в сутки, хотя фактические доходы компании существенно ниже.

Системы ИИ осознают собственные ограничения, когда у них больше времени на «размышления»

В результате исследования, проведённого в Университете Джонса Хопкинса, выяснилось, что если предоставить системам искусственного интеллекта больше времени на анализ информации, то они смогут более точно определять, когда они могут и не могут дать правильный ответ на вопрос.

Ставка ИИ на $305 миллионов: модели логического вывода увеличивают спрос на графические процессоры

Когда DeepSeek-R1 только вышел на рынок, в отрасли преобладал страх, что сложные вычисления можно будет производить с использованием менее сложной инфраструктуры.

Так ли хороша DeepSeek-R1, как о ней говорят

Во всем AI-мире сейчас говорят о новой китайской языковой модели DeepSeek и, конечно, наша команда развития AI не могла пройти мимо этой темы. Мы сравнили ответы новой модели на реальные запросы к нашей базе знаний с ответами других популярных моделей. Что из этого получилось и какие выводы мы сделали расскажу я — Максим Михайлов, продуктовый менеджер Cloud.ru.

Xiaomi внедрит в своего голосового ассистента поддержку DeepSeek-R1

Xiaomi тестирует совместимость голосового ассистента Xiao AI с нейросетевой моделью DeepSeek-R1. Компания работает над расширением возможностей ИИ внутри своей экосистемы HyperOS. 

Так ли страшен DeepSeek, как его малюет Cerebras?

В последнее время две темы в новостях о новейших достижениях в области ИИ привлекали наибольшее внимание специалистов и досужей публики, которая желает все знать — китайский проект DeepSeek и производитель оборудования для ИИ американская компания Cerebras. Здесь, на Хабре своевременно появлялись публикации по обеим темам. Я сходил по некоторым ссылкам к первоисточникам, приведенным в этих публикациях для проверки фактов. Вы тоже можете это сделать, если захотите.

Рейтинг@Mail.ru
Rambler's Top100