Claude. - страница 3

Gemini 2.5 Pro еще ближе к человеку, но реально рассуждать умеют только модели OpenAI

Моя первая статья на Хабре, хочу поделиться своими находками и мыслями.На этой неделе вышла новая модель Gemini 2.5 Pro от Google. Много уже было про нее сказано, но я стараюсь не обращать внимания на волны хайпа вокруг новинок, ориентируясь на свои доверенные источники. Одним из них является любительский бенчмарк SimpleBench, который тестирует здравый смысл в реальной жизни. Этот бенчмарк интересен тем, что в нем самый обычный человек набирает 83.7%, а передовые ИИ модели до сих пор не могут даже приблизиться к этому показателю. Пример вопроса (вольный перевод на русский):

Исследование Anthropic: ИИ умеет планировать и сознательно врать

Учёные из Anthropic опубликовали

Нейронки пошли не туда

Долго пытался сформулировать, почему мне нравится Claude и Gemini и умение рассуждать ChatGPT.И наоборот, не нравится (точнее, кажется по большей части бесполезной на практике) умение ChatGPT написать точный, с первого раза работоспособный код. Или там, решить задачки из олимпиады по математике, выдавая потрясающий балл на экзаменах в MIT.Интуиция не врёт. (Юдковский перевернулся в гробу)

Неделя жизни продакт-лида с ИИ

Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь материалами, которые помогают:Продуктовым менеджерам — интегрировать AI без перегрузки команд;Разработчикам — выбирать инструменты под конкретные бизнес-задачи;Специалистам по данным — избегать ошибок в production-развертывании.У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.Статья A Week in My Life as a Product Leader with AI

Новая DeepSeek V3: рекорды в бенчах, кодинг лучше Claude и GPT-4.5

Позавчера DeepSeek загадочно и молчаливо залили новую модель на HuggingFace, даже не написав ничего не в блоге, ни в README файле.Сегодня, наконец, вышел анонс с подробным описанием характеристик новой модели (а точнее, крутого обновления старой модели). Давайте разбираться, что в этот раз нам подогнали китайские исследователи.

Лучшие нейросети для написания кода и программирования

На заре вычислительных устройств программисты писали код самостоятельно — полностью с нуля и в одиночку. Режим хардкор! Единственное, что могло облегчить их труд, — бумажные справочники, описывающие синтаксические особенности отдельного языка.Сегодня всё иначе. Помимо многочисленных электронных документаций, гайдов, статей, видео и форумов существуют нейросети — похоже, одна из самых прорывных технологий начала 21 века.Обученные на больших объемах данных, теперь они — основные поставщики справочного материала.

Как выбрать LLM-модель, которая заберет у вас работу

Пока одни спорят, заменит ли ИИ людей, другие уже выбирают, какую нейросеть поставить себе в напарники. ChatGPT, Claude, Mistral, а еще китайские модели, которые неожиданно набирают популярность — надо бы разобраться в этом хаосе.Не стоит полагаться только на отзывы или случайные тесты. Разбираемся, по каким критериям действительно стоит оценивать LLM, чтобы выбрать мощную и полезную модель, а не просто хорошо обученного бота.По каким параметрам оценивать языковые модели

Новый инструмент от Anthropic позволяет Claude делать заметки для решения сложных задач

Компания Anthropic нашла простой способ улучшить способность своего помощника на основе искусственного интеллекта выполнять сложные многоэтапные задачи: позволить ему делать заметки по ходу работы. Компания утверждает, что добавление «блокнота», где Клод может записывать свои мысли, в сочетании с примерами подсказок значительно улучшает его способности решать задачи.

Claude внедрила функцию веб-поиска: новые возможности для пользователей

У Claude появилась новая функция веб-поиска, которая помогает находить более актуальные ответы. Когда ИИ-помощник находит информацию в интернете, он показывает пользователям, откуда именно были взяты данные, и преобразует результаты поиска в ответы в диалоговом режиме, а не просто в список ссылок, как в традиционной поисковой системе. Подобные функции уже существуют в таких инструментах, как Perplexity, ChatGPT и Google Gemini.

Сообщается, что Anthropic готовит голосовой режим для Claude

Согласно отчёту, стартап Anthropic, занимающийся искусственным интеллектом, работает над голосовыми возможностями своего чат-бота Claude на базе искусственного интеллекта.

Рейтинг@Mail.ru
Rambler's Top100