исскуственный интеллект.

Mistral Small 3.1 и DeepCoder-14B-Preview появились в библиотеке Ollama

В библиотеке Ollama, популярной платформы для локального запуска LLM, сегодня появились две новые модели: Mistral Small 3.1 и DeepCoder-14B-Preview.

продолжить чтение ......

Оставлено в

Fine tuning или RAG. Что выбрать?

При разработке ИИ чатов существует два способа интеграции внешних данных: RAG хранилища и Fine tuning. Для не технаря отличия не очевидны, я столкнулся с мнением менеджера проекта, что первое это новая версия второго. Это не так. Поэтому, я сделал short summary, чтобы по существу изложить плюсы и минусы двух решенийЧто такое RAG?Языковые модели умеют запускать python/javascript функции через tool_calls. Делается такая функция, ей на вход аргумент search

продолжить чтение ......

Оставлено в

Как запустить языковую модель без цензуры, не имея видеокарты и мощного компьютера

Думаю, все сталкивались с тем, что языковая модель отказывается отвечать на какие-то вопросы. К счастью, в интернете есть опубликованные так называемые abliterated модели, которые не имеют цензуры и отвечают на любые

продолжить чтение ......

Оставлено в

LLM беспристрастно о хорошем и плохом на Хабре

Если что не так, то все претензии к модели, а не ко мне. Я старался вести диалог спокойно, без дурных намерений и каверзных вопросов.LLM ответила очень подробно, по существу, иногда жестко и нелицеприятно, зато беспристрастно.Я бы предложил всему IT-сообществу и владельцам самого портала без обид просто поразмыслить над этими простыми и объективными суждениями и выводами модели. Если каждый что-то изменит на своём уровне возможностей, то будет оздоровление и польза. Моя цель состоит именно в этом.Обратите, пожалуйста, внимание на вопросы о проблемах и недостатках, это действительно стоит того.

продолжить чтение ......

Оставлено в

Балансировка нагрузки LLM через Nginx

Исходный код, разобранный в статье, опубликован в этом репозиторииВ интернете существует множество примеров, которые позволяют подключить ChatGPT 3.5 без инструментов к телеграм боту. Однако, когда речь заходит о большом количестве пользователей, не существуют примеров распределения нагрузки по нескольким процессам: все туториалы в интернете запускают монолит с одной репликой

продолжить чтение ......

Оставлено в

Искусственный Интеллект как проявитель нормального человеческого общения

Часто ли вы общаетесь с чатботами относящимися к т.н. Искусственным Интеллектам? А чтобы вы выбрали: задать вопрос чатботу или человеку? А почему?Вобщем, сейчас я дам вам версию, добавляющую ещё один фактор, возможно, повышающий привлекательность общения с электронными болванами.

продолжить чтение ......

Оставлено в

Уже через год мы будем общаться с базами данных по-русски

По прогнозу Gartner, запросы на естественном языке вытеснят SQL уже в 2026 году. Самое главное из исследования на русском языке собрано в этом посте. Возможно, прогноз Gartner чересчур оптимистичный, но если они и ошибаются, то только в сроках — сам переход на естественный язык в работе с БД неизбежен.

продолжить чтение ......

Оставлено в

AG&I

Архив форума – «Будущее Наступило». Обсуждение ИИРаньше невозможно было представить, насколько сложным и фантастическим станет наш мир. Пройдя долгий и изнурительный путь, человечество подошло к своему главному и неоднозначному творению – искусственному интеллекту.

продолжить чтение ......

Оставлено в

ИИ — напиши мне программу

Предисловие.Можете его не читать.

продолжить чтение ......

Оставлено в

Рассуждающая модель QwQ 32B доступна в Ollama

Мощная рассуждающая языковая модель с открытым исходным кодом QwQ-32B теперь доступна в Ollama. Это среднеразмерная модель с 32.5 миллиардами параметров из серии Qwen разработана для выполнения сложных задач и демонстрирует конкурентоспособное качество по сравнению с другими reasoning моделями, такими как DeepSeek-R1.

продолжить чтение ......

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

исскуственный интеллект.

Mistral Small 3.1 и DeepCoder-14B-Preview появились в библиотеке Ollama

Fine tuning или RAG. Что выбрать?

Как запустить языковую модель без цензуры, не имея видеокарты и мощного компьютера

LLM беспристрастно о хорошем и плохом на Хабре

Балансировка нагрузки LLM через Nginx

Искусственный Интеллект как проявитель нормального человеческого общения

Уже через год мы будем общаться с базами данных по-русски

AG&I

ИИ — напиши мне программу

Рассуждающая модель QwQ 32B доступна в Ollama

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

исскуственный интеллект.