gpt.
Вышел GPT-4.5 от OpenAI [обновляется, UPD 4]
Всего пару недель назад я писал о том, что Сэм Альтман анонсировал скорый выпуск GPT-4.5. Буквально вчера появились первые слухи о том, что GPT-4.5 выйдет со дня на день. И вот, свершилось, официальный анонс только что был опубликован.Официальный блог-пост: https://openai.com/index/introducing-gpt-4-5/Общая информация о модели
OctoTools: Стэнфордская платформа с открытым исходным кодом оптимизирует рассуждения LLM
OctoTools, новая агентная платформа с открытым исходным кодом, выпущенная учеными Стэнфордского университета, может ускорить большие языковые модели для задач рассуждения, разбивая задачи на подблоки и улучшая модели с помощью инструментов. Хотя использование инструментов уже стало важным применением LLM, OctoTools делает эти возможности гораздо более доступными, устраняя технические барьеры и позволяя разработчикам и предприятиям расширять платформу собственными инструментами и рабочими процессами.
Люди больше не нужны? Профессии, которые уже заменил ИИ
2023 - 2024 годы стали переломными для искусственного интеллекта. Развитие технологий ускорилось, а внедрение нейросетей затронуло буквально все сферы жизни. Мощные мультимодальные модели, такие как GPT-4 от OpenAI и Gemini Ultra от Google, теперь способны анализировать не только текст, но и изображения, аудио, код и даже сложные бизнес-данные.
Probing GPT model
Привет, друзья! Этот туториал посвящён зондированию (probing) — простому, но мощному методу для изучения внутренней работы LLM (больших языковых моделей). С его помощью можно получить приближенные знания о паттернах, которые выучивает модель и о том, как эти знания распространяются по слоям. Метод простой, но довольно интересный. К туториалу прилагается ноутбук с кодом. Всех заинтересовавшихся — прошу к чтению!Идея зондирования
Стремление OpenAI к росту оказывает давление на стартапы в сфере AI
Поскольку OpenAI трансформируется из простого поставщика API в компанию, предлагающую полный спектр решений в области искусственного интеллекта, многим стартапам, созданным на основе ее технологии, возможно, придется пересмотреть свои стратегии. Адам Гилберт, менеджер GTM компании OpenAI , говорит, что преимущество компании заключается в наличии всего: мощной инфраструктуры, обширных данных, мощных моделей, возможностей тонкой настройки и удобных для пользователя приложений.
Робот Макс с LLM: история внедрения нейросетей в помощь миллионам пользователей Госуслуг
Привет! На связи команда Робота Макса — цифрового ассистента Госуслуг.
Феномен DeepSeek: разбираем причины шума вокруг нейросети
Понедельник, 27 января, начался с крупнейшего однодневного падения
Как 1С-нику попробовать ChatGPT без VPN или для чего мы встраиваем в MAKER инструменты LLM?
В этой статье расскажу, какие задачи можно и даже нужно делегировать искусственному интеллекту, в чём трудности применения Chat GPT в России. Попробуем составить полноценное ТЗ для создания мобильного приложения на базе 1С:Предприятие с помощью ИИ и сервиса MAKER-STUDIO.Пролог
Учебник — всё, что вам нужно
Немного вызывающее название статьи отсылает к известной работе Внимание - всё, что вам нужно. На этот раз речь пойдет о качестве данных, на которых обучают LLM. Оказывается, качественный учебник (как концентрат знаний в любой сфере) в разы сокращает потребность и в памяти, и в мощности GPU, и в деньгах инвесторов...
Клон ChatGPT в 3000 байтах на C, основанный на GPT-2
Эта программа представляет собой свободную от зависимостей реализацию GPT-2. Она загружает матрицу весов и файл BPE из оригинальных файлов TensorFlow, токенизирует вывод при помощи простого энкодера, работающего по принципу частотного кодирования, реализует базовый пакет для линейной алгебры, в котором заключены математические операции над матрицами, определяет архитектуру трансформера, выполняет инференс трансформера, а затем очищает вывод от токенов при помощи BPE-декодера. Всё это — примерно в 3000 байт на C.