Несмотря на то, что у Microsoft есть крупный инвестиционный партнер – OpenAI, который продолжает анонсировать более мощные модели обработки данных, такие как последняя серия o3, Microsoft не сидит сложа руки. Вместо этого компания занимается разработкой более мощных небольших моделей, выпущенных под собственным брендом.
Сегодня несколько нынешних и бывших исследователей и специалистов Microsoft по искусственному интеллекту объявили на X, что Microsoft выпускает свою модель Phi-4 в качестве полностью открытого проекта с загружаемыми весами на Hugging Face, в сообществе по обмену кодами AI.
«Мы были совершенно поражены реакцией на выпуск модели Phi-4» – написал главный инженер‑исследователь Microsoft AI Шитал Шах в X. «Многие просили нас выпустить веса. Некоторые даже загрузили пиратские веса Phi-4 на HuggingFace. Что ж, больше ждать не нужно. Сегодня мы выпускаем официальную модель Phi-4 на HuggingFace! С лицензией MIT!!»
Весовые коэффициенты относятся к числовым значениям, которые определяют, как языковая модель AI, большая или маленькая, понимает и выводит на печать текст и данные. Весовые коэффициенты модели устанавливаются в процессе обучения, как правило, с помощью глубокого обучения без учителя, в ходе которого модель определяет, какие результаты должны быть получены на основе получаемых входных данных.
Весовые коэффициенты модели могут быть дополнительно скорректированы исследователями и создателями модели, которые добавляют собственные настройки, называемые смещениями, в модель во время обучения. Модель, как правило, не считается полностью открытой, если её весовые коэффициенты не опубликованы, так как именно это позволяет другим исследователям взять модель и полностью настроить её или адаптировать для своих целей.
Хотя Microsoft представила Phi-4 в прошлом месяце, изначально его использование было ограничено новой платформой разработки Microsoft Azure AI Foundry.
Теперь Phi-4 доступен за пределами этого проприетарного сервиса для всех, у кого есть учётная запись Hugging Face, и распространяется по лицензии MIT, позволяющей использовать его и в коммерческих целях.
Этот релиз предоставляет исследователям и разработчикам полный доступ к 14 миллиардам параметров модели, позволяя проводить эксперименты и внедрять решения без ограничений по ресурсам, которые часто возникают при использовании более крупных систем AI.
Phi-4 впервые был представлен на платформе Microsoft Azure AI Foundry в декабре 2024 года, где разработчики могли получить к нему доступ по соглашению об исследовательской лицензии.
Модель быстро привлекла к себе внимание, поскольку превосходила более крупные аналоги в таких областях, как математические вычисления и многозадачное понимание языка, при этом требуя значительно меньше вычислительных ресурсов.
Оптимизированная архитектура модели и ее ориентация на рассуждения и логику призваны удовлетворить растущую потребность в высокопроизводительном искусственном интеллекте, который остается эффективным в условиях ограниченных вычислительных мощностей и памяти.
Выпуская эту модель с открытым исходным кодом по разрешенной лицензии MIT, Microsoft делает Phi-4 более доступным для более широкой аудитории исследователей и разработчиков, даже коммерческих, что свидетельствует о потенциальном изменении подхода к разработке и внедрению моделей в индустрии искусственного интеллекта.
Автор: mefdayy