архитектура.

ML-проект моей мечты. Часть 1

Сегодня я хочу поговорить о том, как можно организовать код внутри своего проекта таким образом, чтобы всем было удобно им пользоваться. Считаю, что это важный этап разработки, который напрямую влияет на многие аспекты, в том числе на удовлетворённость от работы. Эта тема, по моему мнению, является

продолжить чтение

Оставлено в

Изоляция контекста через субагенты: архитектурный паттерн для долгосрочной работы с Claude Code

Как превратить Claude Code из мощного ассистента в профессиональную платформу оркестрации с 33+ специализированными агентамиКонтекст: кто пишет и почему это важноИгорь Масленников. В IT с 2013 года. Много лет управлял классической IT-компанией DNA IT. Последние два года активно развиваю подразделение AI Dev Team — и вижу интересную тенденцию: всё больше клиентов выбирают именно это подразделение. Не потому что модно, а потому что быстрее (1-2 недели вместо 2-3 месяцев), дешевле (минус 80% от стоимости), и, как ни странно, качественнее благодаря автоматическим проверкам.

продолжить чтение

Оставлено в

Google представила архитектуру Titans и фреймворк MIRAS

Google представили архитектуру Titans и фреймворк MIRAS, которые позволяют моделям ИИ работать гораздо быстрее и обрабатывать большие объемы данных за счет обновления основной памяти во время ее активной работы. В двух новых статьях,

продолжить чтение

Оставлено в

Архитектура высоконагруженных RAG-систем: 10 стратегий оптимизации чанкинга и интеграция с Weaviate, Qwen – Llama -Gemma

Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день, создавая такие системы, и сделаю акцент на чанкинге.

продолжить чтение

Оставлено в

Приглашаем на ЮMoneyDay — бесплатную онлайн-конференцию про финтех и IT

5 и 6 декабря состоится ЮMoneyDay 2025 — бесплатная онлайн-конференция для разработчиков, аналитиков, инженеров, менеджеров и дизайнеров. Встречаемся в 11:00 мск.

продолжить чтение

Оставлено в

Мульти-модельная оркестрация LLM: архитектура маршрутизации, которая снизила затраты в 117 раз

Как мы провели 12,000+ API-вызовов к 11 моделям, открыли правило 60-70, и построили систему маршрутизации с ROI 4,853xКонтекст: кто пишет и о чём эта статьяИгорь Масленников. В IT с 2013 года. Последние два года развиваю AI Dev Team в DNA IT — подразделение, которое работает на мульти-модельной архитектуре. Это техническая статья о том, как мы построили систему оркестрации LLM-моделей для платформы генерации образовательных курсов.Статья для тех, кто:Строит AI-продукты и упирается в стоимость APIДумает о мульти-модельной архитектуре, но не знает, с чего начать

продолжить чтение

Оставлено в

Приглашаем на двухдневную онлайн-конференцию для IT-специалистов в финтехе

Бесплатная ежегодная онлайн-конференция ЮMoney Day состоится 5 и 6 декабря. Это уже седьмая конференция, где представители ЮMoney делятся опытом работы в финтехе. Вас ждёт более 20 докладов по разным направлениям: бэкенд, фронтенд, архитектура, тестирование, SQL и другие.

продолжить чтение

Оставлено в

Под капотом современных AI-систем: разбираем железо

Как объединить по сети вычислители? Что происходит при компиляции кода для железа под капотом и какие есть нюансы при работе с AI в пространстве ядра? ИИ с ноги ворвался во все сферы разработки, работы — вагон и маленькая тележка. Но на чём и как она должна ехать? У каждой программы есть свои требования, универсальных советов нет.

продолжить чтение