Mistral Small 3.1 и DeepCoder-14B-Preview появились в библиотеке Ollama
В библиотеке Ollama, популярной платформы для локального запуска LLM, сегодня появились две новые модели: Mistral Small 3.1 и DeepCoder-14B-Preview.
Fine tuning или RAG. Что выбрать?
При разработке ИИ чатов существует два способа интеграции внешних данных: RAG хранилища и Fine tuning. Для не технаря отличия не очевидны, я столкнулся с мнением менеджера проекта, что первое это новая версия второго. Это не так. Поэтому, я сделал short summary, чтобы по существу изложить плюсы и минусы двух решенийЧто такое RAG?Языковые модели умеют запускать python/javascript функции через tool_calls. Делается такая функция, ей на вход аргумент search
Как запустить языковую модель без цензуры, не имея видеокарты и мощного компьютера
Думаю, все сталкивались с тем, что языковая модель отказывается отвечать на какие-то вопросы. К счастью, в интернете есть опубликованные так называемые abliterated модели, которые не имеют цензуры и отвечают на любые
LLM беспристрастно о хорошем и плохом на Хабре
Если что не так, то все претензии к модели, а не ко мне. Я старался вести диалог спокойно, без дурных намерений и каверзных вопросов.LLM ответила очень подробно, по существу, иногда жестко и нелицеприятно, зато беспристрастно.Я бы предложил всему IT-сообществу и владельцам самого портала без обид просто поразмыслить над этими простыми и объективными суждениями и выводами модели. Если каждый что-то изменит на своём уровне возможностей, то будет оздоровление и польза. Моя цель состоит именно в этом.Обратите, пожалуйста, внимание на вопросы о проблемах и недостатках, это действительно стоит того.
Балансировка нагрузки LLM через Nginx
Исходный код, разобранный в статье, опубликован в этом репозиторииВ интернете существует множество примеров, которые позволяют подключить ChatGPT 3.5 без инструментов к телеграм боту. Однако, когда речь заходит о большом количестве пользователей, не существуют примеров распределения нагрузки по нескольким процессам: все туториалы в интернете запускают монолит с одной репликой
Искусственный Интеллект как проявитель нормального человеческого общения
Часто ли вы общаетесь с чатботами относящимися к т.н. Искусственным Интеллектам? А чтобы вы выбрали: задать вопрос чатботу или человеку? А почему?Вобщем, сейчас я дам вам версию, добавляющую ещё один фактор, возможно, повышающий привлекательность общения с электронными болванами.
Уже через год мы будем общаться с базами данных по-русски
По прогнозу Gartner, запросы на естественном языке вытеснят SQL уже в 2026 году. Самое главное из исследования на русском языке собрано в этом посте. Возможно, прогноз Gartner чересчур оптимистичный, но если они и ошибаются, то только в сроках — сам переход на естественный язык в работе с БД неизбежен.
AG&I
Архив форума – «Будущее Наступило». Обсуждение ИИРаньше невозможно было представить, насколько сложным и фантастическим станет наш мир. Пройдя долгий и изнурительный путь, человечество подошло к своему главному и неоднозначному творению – искусственному интеллекту.
Рассуждающая модель QwQ 32B доступна в Ollama
Мощная рассуждающая языковая модель с открытым исходным кодом QwQ-32B теперь доступна в Ollama. Это среднеразмерная модель с 32.5 миллиардами параметров из серии Qwen разработана для выполнения сложных задач и демонстрирует конкурентоспособное качество по сравнению с другими reasoning моделями, такими как DeepSeek-R1.