Claude.

Gemini 2.5 Pro еще ближе к человеку, но реально рассуждать умеют только модели OpenAI

Моя первая статья на Хабре, хочу поделиться своими находками и мыслями.На этой неделе вышла новая модель Gemini 2.5 Pro от Google. Много уже было про нее сказано, но я стараюсь не обращать внимания на волны хайпа вокруг новинок, ориентируясь на свои доверенные источники. Одним из них является любительский бенчмарк SimpleBench, который тестирует здравый смысл в реальной жизни. Этот бенчмарк интересен тем, что в нем самый обычный человек набирает 83.7%, а передовые ИИ модели до сих пор не могут даже приблизиться к этому показателю. Пример вопроса (вольный перевод на русский):

продолжить чтение ......

Оставлено в

Исследование Anthropic: ИИ умеет планировать и сознательно врать

Учёные из Anthropic опубликовали

продолжить чтение ......

Оставлено в

Нейронки пошли не туда

Долго пытался сформулировать, почему мне нравится Claude и Gemini и умение рассуждать ChatGPT.И наоборот, не нравится (точнее, кажется по большей части бесполезной на практике) умение ChatGPT написать точный, с первого раза работоспособный код. Или там, решить задачки из олимпиады по математике, выдавая потрясающий балл на экзаменах в MIT.Интуиция не врёт. (Юдковский перевернулся в гробу)

продолжить чтение ......

Оставлено в

Неделя жизни продакт-лида с ИИ

Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь материалами, которые помогают:Продуктовым менеджерам — интегрировать AI без перегрузки команд;Разработчикам — выбирать инструменты под конкретные бизнес-задачи;Специалистам по данным — избегать ошибок в production-развертывании.У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.Статья A Week in My Life as a Product Leader with AI

продолжить чтение ......

Оставлено в

Новая DeepSeek V3: рекорды в бенчах, кодинг лучше Claude и GPT-4.5

Позавчера DeepSeek загадочно и молчаливо залили новую модель на HuggingFace, даже не написав ничего не в блоге, ни в README файле.Сегодня, наконец, вышел анонс с подробным описанием характеристик новой модели (а точнее, крутого обновления старой модели). Давайте разбираться, что в этот раз нам подогнали китайские исследователи.

продолжить чтение ......

Оставлено в

Лучшие нейросети для написания кода и программирования

На заре вычислительных устройств программисты писали код самостоятельно — полностью с нуля и в одиночку. Режим хардкор! Единственное, что могло облегчить их труд, — бумажные справочники, описывающие синтаксические особенности отдельного языка.Сегодня всё иначе. Помимо многочисленных электронных документаций, гайдов, статей, видео и форумов существуют нейросети — похоже, одна из самых прорывных технологий начала 21 века.Обученные на больших объемах данных, теперь они — основные поставщики справочного материала.

продолжить чтение ......

Оставлено в

Как выбрать LLM-модель, которая заберет у вас работу

Пока одни спорят, заменит ли ИИ людей, другие уже выбирают, какую нейросеть поставить себе в напарники. ChatGPT, Claude, Mistral, а еще китайские модели, которые неожиданно набирают популярность — надо бы разобраться в этом хаосе.Не стоит полагаться только на отзывы или случайные тесты. Разбираемся, по каким критериям действительно стоит оценивать LLM, чтобы выбрать мощную и полезную модель, а не просто хорошо обученного бота.По каким параметрам оценивать языковые модели

продолжить чтение ......

Оставлено в

Новый инструмент от Anthropic позволяет Claude делать заметки для решения сложных задач

Компания Anthropic нашла простой способ улучшить способность своего помощника на основе искусственного интеллекта выполнять сложные многоэтапные задачи: позволить ему делать заметки по ходу работы. Компания утверждает, что добавление «блокнота», где Клод может записывать свои мысли, в сочетании с примерами подсказок значительно улучшает его способности решать задачи.

продолжить чтение ......

Оставлено в

Claude внедрила функцию веб-поиска: новые возможности для пользователей

У Claude появилась новая функция веб-поиска, которая помогает находить более актуальные ответы. Когда ИИ-помощник находит информацию в интернете, он показывает пользователям, откуда именно были взяты данные, и преобразует результаты поиска в ответы в диалоговом режиме, а не просто в список ссылок, как в традиционной поисковой системе. Подобные функции уже существуют в таких инструментах, как Perplexity, ChatGPT и Google Gemini.

продолжить чтение ......

Оставлено в

Сообщается, что Anthropic готовит голосовой режим для Claude

Согласно отчёту, стартап Anthropic, занимающийся искусственным интеллектом, работает над голосовыми возможностями своего чат-бота Claude на базе искусственного интеллекта.

продолжить чтение ......

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Claude.

Gemini 2.5 Pro еще ближе к человеку, но реально рассуждать умеют только модели OpenAI

Исследование Anthropic: ИИ умеет планировать и сознательно врать

Нейронки пошли не туда

Неделя жизни продакт-лида с ИИ

Новая DeepSeek V3: рекорды в бенчах, кодинг лучше Claude и GPT-4.5

Лучшие нейросети для написания кода и программирования

Как выбрать LLM-модель, которая заберет у вас работу

Новый инструмент от Anthropic позволяет Claude делать заметки для решения сложных задач

Claude внедрила функцию веб-поиска: новые возможности для пользователей

Сообщается, что Anthropic готовит голосовой режим для Claude

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Claude.