Состояние моделей рассуждения LLM
Часть 1: Методы масштабирования вычислительной мощности во время выводаУлучшение способностей к рассуждению больших языковых моделей (LLM) стало одной из самых обсуждаемых тем в 2025 году – и не без оснований. Улучшенные навыки рассуждения позволяют моделям решать более сложные задачи, что делает их полезными в самых разных областях, интересных пользователям.
Как гонка за AI-талантами меняет рынок труда в сфере технологий
От финансов до розничной торговли — компании всё чаще ищут специалистов с навыками работы в сфере искусственного интеллекта при найме сотрудников в области технологий.Компании всё чаще задают потенциальным сотрудникам вопрос: «Вы умеете работать с ИИ?»
AI Engineering vs ML Engineering: Как фундаментальные модели меняют подход к разработке
В эпоху, когда ИИ проникает в каждый сектор, понимание различий между AI Engineering и ML Engineering становится ключевым для выбора стратегии разработки. Книга AI Engineering: Building Applications with Foundation Models ярко иллюстрирует, как фундаментальные модели (foundation models) переворачивают традиционные подходы. Вот что важно знать.Почему сегодня AI Engineering вытесняет ML Engineering?Демократизация доступа к ИИ— Раньше: Создание ML‑моделей требовало месяцев работы с raw data, обучения архитектур и настройки гиперпараметров. Например, обучение GPT-3 потребовало 3,5 тыс. GPU‑лет.— Сейчас
LLM во временных рядах: от предикта температуры до криптовалют
Базовое желание человека -- знать что будет дальше. Какая завтра погода, в какое время не будет пробок, сколько будет стоить нефть и бакс. Было бы удобно провести быстрый анализ с LLM, ведь у каждого есть доступ хотя бы к одной нашумевшей нейросетке. Тем более LLM уже может прогнозировать будущее! Ниже вы можете посмотреть результаты прогноза для разных временных рядов из статьи Large Language Models Are Zero Shot Time Series Forecasters.Остается лишь вопрос, а можно ли лучше? Давайте разберемся!
Salesforce обновила платформу Agentforce: теперь их ИИ-агенты могут автономно управлять корпоративными системами
Сегодня Salesforce объявила о запуске Agentforce 2dx
Deutsche Telekom и Perplexity объявили о новом «AI Phone» стоимостью менее 1 000 долларов
Еще до начала MWC в Барселоне было очевидно, что хотя бы один оператор представит амбициозный проект по созданию смартфона совместно с ведущей AI-компанией. И вот он: Deutsche Telekom (DT) сообщает, что готовит «AI Phone»
10 примеров и вариантов использования RAG от реальных компаний. Со схемами и пояснениями
Приходилось ли вам когда-нибудь упрекать чат-бот с LLM — к примеру, ChatGPT или Claude — в устаревшей или неточной информации?Дело в том, что, формируя ответ, крупные языковые модели (LLM) опираются на наборы данных, на которых они были обучены. Однако, поскольку их основная задача — предсказывать текст, а не извлекать факты, на их точность нельзя полагаться во всех случаях. Кроме того, обучающие датасеты обычно ограничены общедоступными данными и в некоторых областях быстро теряют актуальность.
Почему искусственный интеллект такой дорогой: пять причин от Bloomberg
Стремление к созданию более масштабных моделей искусственного интеллекта, а также увеличение числа чипов и дата-центров для их разработки, оборачивается значительными расходами для технологических компаний.Важное примечание
AI-first компании развиваются быстрее и действуют иначе. Перевод колонки издания WSJ
Дисклеймер: это вольный перевод колонки
Telegram бот + ИИ Jlama своими руками
Хабр, привет! Сегодня мы попробуем сделать свой ИИ с телеграм ботом для возможности простого общения с ней. Сразу оговорюсь, мы не будем в очередной раз использовать открытый API ChatGPT или новомодного Deepseek. Мы развернем свой полноценный ИИ локально и сынтегрируем его с телеграм ботом.LLM модель