ml.
Тренды ИИ-2025
Всем привет! Я Федор Горбунов, руководитель направления машинного обучения в Doubletapp. Сегодня поговорим о том, какие значимые для искусственного интеллекта события произошли в 2024 году и попробуем спрогнозировать вектор развития отрасли в будущем.
Практический кейс: как применять ML и GPT для поиска дубликатов в базе данных
Привет! Я Давид Акопян, занимаюсь интеграциями ML, GPT и консалтингом. Сейчас работаю тимлидом продуктовой аналитики в Авито. Ранее был опыт в:EY операционном консалтинге в сфере ретейла. Консультировал такие компании как Магнит, Детский Мир, Аскона, МВидео, НЛМК;E-groccery-стартапе;был тимлидом аналитики обычной и экспресс-доставки Яндекс.Маркета; а еще пробовал себя в различных проектах во фрилансе.
Самураи искусственного интеллекта
В одной из предыдущих статей я уже упоминал нобелевского лауреата по физике 2024 года Джеффри Хинтона (праправнук Джорджа Буля). Вторым лауреатом стал Джон Хопфилд. Сеть Хопфилда
Как банки предсказывают кредитные риски: опыт создания PD-моделей из ФинТеха
Представьте, что вы управляете кредитным портфелем банка: каждый выданный кредит – это ставка на то, что клиент выполнит свои обязательства. Как понять, кто из заемщиков надежен, а кто может не справиться с платежами? Здесь на помощь приходят Probability of Default (PD) модели.PD-модели – это инструменты, используемые в банковском секторе для оценки вероятности дефолта заемщика в течение определенного периода времени. Они играют важную роль в управлении рисками и кредитной политике банка.
Открытые книги по ML и работе с данными
Мы регулярно публикуем подборки литературы для специалистов: делали дайджест книг для желающих поближе познакомиться с Postgres и Kubernetes
Алгоритмы спекулятивного инференса LLM
ВведениеЗа последние годы качество LLM моделей сильно выросло, методы квантизации стали лучше, а видеокарты мощнее. Тем не менее качество генерации все еще напрямую зависит от размера весов и, как следствие, вычислительной сложности. Кроме того, генерация текста авторегрессионна - токен за токеном по одному, потому ее сложность зависит от размера контекста и количества генерируемых токенов.Но генерация текста не всегда имеет однородную сложность, так же как мы во многом мыслим идеями, а слова произносим “на автомате”. В статье обсудим алгоритмы, позволяющие использовать эту неоднородность для ускорения.
Почему OpenAI откладывает релиз ChatGPT-5? Все дело в недостатке данных
Новый проект OpenAI в области искусственного интеллекта, получивший кодовое название Orion, столкнулся с множеством проблем. Он отстает от графика и требует огромных затрат. Неясно, когда и будет ли он работать. Возможно, в мире недостаточно данных, чтобы сделать его достаточно умным.Дисклеймер: это вольный перевод
Опыт интеграции LLM и классического ML в пет-проект про поиск домашних животных
AI-решения сейчас повсеместно, но всё ещё есть места, где их нет. Например в вашем пет-проекте (возможно).В статье я поделюсь опытом, как легко интегрировать LLM и сразу получить от этого пользу, встраивая результаты от LLM в дальнейший пайплайн и закладывая фундамент под дальнейшее развитие.
Машинное обучение и резервы банка: опыт из ФинТеха
Оценка резервов кредитного портфеля — одна из задач, с которой я работал на протяжении продолжительного времени в своей практике. Это интересная и сложная задача, о которой я расскажу.В этой статье я расскажу о том, что такое резервы и зачем они необходимы банкам, как банки проводят оценку резервов, а также где в этой задаче можно использовать машинное обучение.Что такое резервы?Резервы, или ожидаемые кредитные потери (ECL
Пять элементов Inference-платформы Selectel. Как мы сделали своего Аватара
Когда дело доходит до инференса ML-моделей, на ум приходит стандартный вариант — задеплоить Helm chart с Triton в Kubernetes. А что если добавить магии, как в «Аватаре»? Привет! Я — Антон, DevOps-инженер в команде Data/ML-продуктов Selectel. В статье я продолжу рассказывать о нашем новом продукте — Inference-платформе (для которой все еще доступен бесплатный двухнедельный тест). На этот раз рассмотрим пять новых фичей, которые и отличают ее от стандартного варианта. Прошу под кат — там тест работающих моделей без даунтайма, генерация котят голосом и много другой магии.