llm. - страница 6

llm.

Что думает LLM о смысле жизни программиста

Для начала афоризм от LLM."Жизнь - это рекурсивная функция. Но если ты нашел способ выйти из цикла, то ты постиг смысл жизни и уже достиг просветления."

продолжить чтение

Яндекс опубликовал программу ежегодной конференции Practical ML Conf

На сайте конференции Practical ML Conf мы опубликовали первый список докладов. Среди тем этого года — сложности разработки мультимодальных нейросетей, технологии синтеза выразительной речи, обучение больших языковых моделей работе с кодом.

продолжить чтение

Нейросеть Llama3 получила улучшенное понимание речи

Разработчики Llama3-s v0.2 поделились улучшениями, которые модель продемонстрировала в тестах понимания речи и способности «слушать». В llama3-s v0.1 начали внедрять акустические токены. В v0.2 реализовали слияние с семантическими токенами, которые обладают такими преимуществами, как простота, лучшее сжатие и последовательное извлечение признаков речи.

продолжить чтение

Reuters: китайские госкомпании пользуются американскими ИИ-технологиями через облачные сервисы Amazon и её конкурентов

продолжить чтение

Как сократить расходы на инференс LLM? Разберемся на вебинаре

Привет, Хабр! Присоединяйтесь к вебинару 22 августа в 16:00 мск. Особенно ждем ML- и MLOps-инженеров, Data Scientists и NLP-инженеров, CTO и менеджеров ML-проектов. Поделимся опытом команды «Актион», которая сократила расходы на GPU на 60% и увеличила пропускную способность в 36 раз благодаря решению Compressa на инфраструктуре Selectel. Участникам дадим бесплатный двухнедельный тест LLM-платформы Compressa на инфраструктуре Selectel с GPU.Зарегистрироваться →ПрограммаПроблемы внешних API и open-source моделей «из коробки»Способы оптимизации LLM-моделей на своем сервере

продолжить чтение

Qwen2-Math — Alibaba Cloud выпустила серию LLM для решения математических задач любой сложности

Alibaba Cloud представила Qwen2-Math, новую серию LLM с открытым исходным кодом, предназначенную для решение математических задач. Модели основаны на платформе Qwen2, которая уже используется многими компаниями, преимущественно в Китае.

продолжить чтение

Новые продукты AI-лаборатории ИТМО и Х5 Tech

Совместная магистратура по искусственному интеллекту ИТМО и Napoleon IT – AI Talent Hub – в сентябре 2023 года запустила лабораторию по искусственному интеллекту c компанией X5 Tech на базе института. В течение 9 месяцев молодые ML-инженеры работали в одной команде с опытными экспертами X5 Tech и разработали MVP системы с использованием моделей машинного обучения для внедрения в процессы ритейлера X5 Group.

продолжить чтение

Как работают языковые модели

Руководство вообще без жаргона

продолжить чтение

PandasAI — кратно ускоряем работу аналитика данных в одну строчку

Привет, чемпион!За прошедший год появилось много полезных AI инструментов для упрощения работы разработчиков, аналитиков данных и даже дизайнеров: Copilot допишет за тебя код, EverSQL оптимизирует SQl-запрос, а Kittl нарисует логотип. А сейчас поговорим о PandasAI -  аналоге классической библиотеки pandas на стероидах ChatGPT. Как работает PandasAI?По сути это LLM агент, которые имеет доступ к Pandas. Агенту необходимо передать вопрос или указание на естественном языке, а он на основе данных найдет, построит диаграмму или преобразует данные. Примеры запросов:

продолжить чтение

GigaChat + RAG: как гига нам инструкции для разметки пишет в 3 раза быстрее

Почти за всем хорошим ML стоят хорошие данные. И так получилось, что таких данных часто нет и их приходится добывать, а даже добыв, из них нужно сделать что-то подходящее, и (если сильно огрубить) такой процесс называется разметкой.Пример задачи по сегментации видео-кадров и пример инструкции к ней

продолжить чтение

Rambler's Top100