llm. - страница 2

llm.

Mistral выкатили Devstral 2 — открытая SOTA модель для кодинга

Неделю назад мы писали про Mistral 3 с MoE-моделью на 675B параметров. Сегодня компания представила Devstral 2 — новое поколение открытых моделей для кодинга.Главное:Devstral 2 (123B): 72.2% на SWE-bench Verified, фактически новый SOTA среди open-weight кодовых агентов.

продолжить чтение

Создание корпоративной Базы Знаний для внедрения LLM-инструментов

В статье описываю практический опыт построения корпоративного ИИ-ассистента: от структуры базы знаний и графовой модели до фильтрации контекста и контроля версий. Материал будет полезен продактам, архитекторам, маркетологам и всем, кто внедряет ИИ в бизнес-процессы. «Garbage in - garbage out», как мусор в корпоративной Базе Знаний мешает корректной работе ИИ и как мы предлагаем это исправить.Сегодня многие компании внедряют ИИ-агентов по упрощённому сценарию: загружают PDF-регламенты, Excel-прайсы и архивы переписок в векторную БД, после чего ожидают, что модель будет корректно отвечать на вопросы пользователей.

продолжить чтение

13 рецептов создания AI-ассистента для музыкального театра: от онбординга до классификатора

В предыдущей статье на ХАБРе  (https://habr.com/ru/articles/972634/) я рассказал о том, что создал за 6 недель CRM для Музыкального театра. Сейчас кажется, что статья получилась абстрактной, в стиле: “из молока можно приготовить сырники, мороженое и кефир - и процесс увлекателен, если ты опытный повар!”. Возможно, зайдет рассказ о том как приготовить то или иное блюдо, этакая книга рецептов - погнали.

продолжить чтение

Что такое LLMs.txt и LLMs-full.txt и как заставить AI знать документацию наизусть

Мы привыкли к классическому набору любого сайта: robots.txt экономит ресурсы сервера, запрещая поисковикам сканировать мусорные страницы, а sitemap.xml, наоборот, скармливает поисковикам каждую доступную страницу для полной индексации.Однако ситуация изменилась, когда сайты начали читать не только поисковые роботы, но и языковые модели. Для них существующие стандарты не подходят: sitemap избыточен и ресурсоёмок, а HTML-код создаёт слишком много шума.Понадобился новый способ доставки актуального, очищенного контекста в сжатом виде специально для AI-агентов и языковых моделей.В сентябре 2024 года Джереми Ховард (создатель

продолжить чтение

Код пишет нейросеть. Что остается разработчику?

Привет, Хабр!В последнее время я часто слышу апокалиптические прогнозы: «Скоро программисты будут не нужны, Claude напишет любой сервис за секунду». Я больше 10 лет руковожу студией разработки, и мой опыт применения нейросетей на практике в наших проектах сегодня говорит об обратном: программисты никуда не исчезнут, но их роль меняется прямо сейчас.Я различаю два принципиально разных подхода к использованию LLM в разработке:Первый — условный «вайб-кодинг»: вы кидаете в чат задачу и ждёте, что нейросеть как-то сама придумает архитектуру, сценарии и интерфейсы.

продолжить чтение

Команда In2AI — победитель MindGames Arena на NeurIPS 2025

Соревнование MindGames Arena проводится как часть одной из ключевых конференций в области ИИ NeurIPS 2025 и проверяет, могут ли агенты демонстрировать социально‑стратегические способности — моделировать убеждения других, обнаруживать обман, координироваться и планировать в многоходовых взаимодействиях — все это, общаясь на естественном языке. Команда In2AI Института AIRI, стартапа Coframe и Университета Иннополис заняла первое место в треке Generalization в двух категориях:Efficient: модели с открытым исходным кодом до 8 миллиардов параметров.

продолжить чтение

CognitiveDrone: система на VLA с когнитивными способностями для управления летающим роботом в трехмерном пространстве

VLA-модели объединяют визуальное восприятие, понимание естественного языка и выполнение физических действий. Обычно они применяются для манипуляций — например, чтобы робот взял предмет или повернул рычаг. Но управление роботом, особенно летающим, это не всегда изменение состояния — иногда это перемещение его в трехмерном пространстве. Добавление VLA-моделей в этот сегмент робототехники может дать устройствам способность мыслить и принимать решения в условиях слабой связи или полной автономности. Такой подход особенно важен для задач, где нет права на ошибку, например в спасательных миссиях. 

продолжить чтение

Внедряем Gemini во все поля ввода Windows: Бесплатно, без смс и с обходом ограничений

Привет, Хабр! Меня зовут Виталий, я графический дизайнер, который однажды устал переключаться между окнами, чтобы перевести текст и исправлять опечатки с ошибками в очередном сообщении. Полгода назад я писал о первой версии ClipGen — утилиты, которая живет в буфере обмена и по хоткею скармливает выделенный текст нейронке (Gemini). Выделил → Ctrl+F1 → Текст исправился. Быстро, бесплатно, сердито. Тогда жизнь была прекрасна: Google давал 1000 бесплатных запросов в сутки на модели Gemini. Но недавно «корпорация добра» закрутила гайки

продолжить чтение

Почерк LLM: аналитики F6 изучили атаку с использованием PureCrypter и DarkTrack RAT

С каждым днем искусственный интеллект всё больше интегрируется в нашу жизнь и облегчает многие задачи. Но, к сожалению, он также используется и в арсенале киберпреступников.

продолжить чтение

Могут ли нейросети понять самих себя?

Большие языковые модели остаются загадкой даже для собственных создателей. Исследователи постепенно раскрывают отдельные механизмы: модели используют специфические паттерны активации для различения знакомых и незнакомых людей, оценки правдивости утверждений, кодирования пространственно-временных координат. Но знают ли сами модели об этих внутренних представлениях? Способны ли они описать собственный мыслительный процесс?

продолжить чтение

Rambler's Top100