python.

Порядок работы с устареванием ML моделей. Шаг 2: Создание надежных и долговечных моделей

ВведениеЕще на этапе создания модели следует проделать работу, направленную на замедление ее устаревания.Реализацию процесса работы с устареванием моделей в ML можно разделить на 4 шага:Шаг 1: Понимание устареванияШаг 2: Создание надежных и долговечных моделейШаг 3: Внедрение системы мониторингаШаг 4: Переобучение и поддержание актуальности моделиВ этой части мы с вами узнаем, как создать надежную и долговечную модель, а также получить много полезной информации, которая поможет нам бороться с устареванием в будущем.

продолжить чтение ......

Оставлено в

Эксперимент, программирование с минимальным участием программиста-человека. Новый этап эволюции или начало деградации

продолжить чтение ......

Оставлено в

Как научить модель рассуждать, не переобучая её, меньше чем за 10$

ВведениеЭто статья обобщение моего исследования передачи знаний от большой модели с замороженными весами в малую модель, которую мы будем обучать через расширенный механизм кросс внимания или проще говоря через LLM модули. Оригинальное исследование доступно по ссылке: arxiv.org/abs/2502.08213 . Репозиторий с кодом и весами доступен на Hugging Face: LLM модули.

продолжить чтение ......

Оставлено в

Backend Odyssey: хакни головоломку ритейла

6 марта мы запускаем Backend Odyssey — серию митапов о нюансах разработки в ритейле. На повестке дня: актуальные тренды, технологии и всё, что движет этой бешеной индустрией. Мы собрали лучших из лучших: Яндекс Лавка, Альфа-Банк, X5 Tech и не только. Митап пройдёт в офлайн и онлайн форматах — так что не важно, где вы находитесь, присоединяйтесь к нам!Какие темы будем обсуждать?Инновации в управлении процессами: забудьте о старых подходах.Искусственный интеллект: как он меняет игру и как нам с этим жить.Адаптация к требованиям рынка: быстро, гибко, без компромиссов.

продолжить чтение ......

Оставлено в

Обучить модель RoBERTa расстановке запятых на балконе для продакшена

RoBERTa — улучшенная версия модели BERT, разработанная Facebook AI. Она показывает отличные результаты в задачах обработки естественного языка, таких как классификация текстов и генерация ответов.

продолжить чтение ......

Оставлено в

Русские тексты. Работа с текстами. Предварительная обработка русских текстовых данных

Предварительная обработка текстовых данных: ключевые этапы и методыТекстовые данные — один из самых сложных типов данных для анализа из-за их неструктурированной природы и высокой вариативности. Чтобы превратить "сырой" текст в информацию, пригодную для машинного обучения или лингвистического анализа, требуется предварительная обработка. Этот процесс включает стандартизацию, очистку и преобразование текста, что повышает качество моделей NLP (Natural Language Processing). Рассмотрим основные этапы и методы.

продолжить чтение ......

Оставлено в

Все, что нужно для создания приложений с LLM: обзор возможностей LangChain

Сегодня появляется все больше и больше приложений на основе больших языковых моделей — условным чат-ботом в Telegram уже никого не удивить. В рамках обучения в магистратуре AI Talent Hub мне не раз приходилось разрабатывать такие приложения с использованием ChatGPT или GigaChat. В этой статье я расскажу о полезном инструменте для работы с LLM - мы рассмотрим главные возможности фреймворка LangChain, а также методы мониторинга и проверки качества существующего приложения с ИИ.

продолжить чтение ......

Оставлено в

Автоматизация разведочного анализа данных (EDA) с помощью Python

Всем привет! Меня зовут Константин Некрасов, я работаю дата-сайентистом в Газпромбанке. Хочу рассказать про инструмент, который серьезно упростил мою повседневную работу с данными, и поделиться им.Если вы когда-нибудь занимались машинным обучением, то знаете — перед тем как строить модель, нужно как следует изучить свои данные. Этот этап называется EDA (Exploratory Data Analysis), или разведочный анализ данных (РАД). Он критически важен — именно здесь мы находим скрытые закономерности, выдвигаем первые гипотезы и понимаем, как лучше обработать данные для будущей модели.

продолжить чтение ......

Оставлено в

Как LangChain и LangGraph упрощают жизнь разработчика ИИ-Агентов

При разработке приложений на основе больших языковых моделей (LLM, Large Language Model) встает вопрос: вызывать ли модель напрямую через API (например, OpenAI) или использовать специализированные фреймворки вроде LangChain или LangGraph. Ниже мы рассмотрим, с какими сложностями сталкивается разработчик при прямом использовании LLM, и как LangChain и LangGraph помогают упростить создание сложных диалоговых и агентных систем. Также приведем примеры кода, сравнивая прямые вызовы с использованием этих фреймворков, и обсудим, когда их применение оправдано.Проблемы при прямом вызове LLM API

продолжить чтение ......

Оставлено в

Учебник — всё, что вам нужно

Немного вызывающее название статьи отсылает к известной работе Внимание - всё, что вам нужно. На этот раз речь пойдет о качестве данных, на которых обучают LLM. Оказывается, качественный учебник (как концентрат знаний в любой сфере) в разы сокращает потребность и в памяти, и в мощности GPU, и в деньгах инвесторов...

продолжить чтение ......

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

python.

Порядок работы с устареванием ML моделей. Шаг 2: Создание надежных и долговечных моделей

Эксперимент, программирование с минимальным участием программиста-человека. Новый этап эволюции или начало деградации

Как научить модель рассуждать, не переобучая её, меньше чем за 10$

Backend Odyssey: хакни головоломку ритейла

Обучить модель RoBERTa расстановке запятых на балконе для продакшена

Русские тексты. Работа с текстами. Предварительная обработка русских текстовых данных

Все, что нужно для создания приложений с LLM: обзор возможностей LangChain

Автоматизация разведочного анализа данных (EDA) с помощью Python

Как LangChain и LangGraph упрощают жизнь разработчика ИИ-Агентов

Учебник — всё, что вам нужно

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

python.