Как организована поддержка open-source ИИ-проектов в Китае. deepseek.. deepseek. Open source.. deepseek. Open source. Блог компании ИТМО.. deepseek. Open source. Блог компании ИТМО. искусственный интеллект.. deepseek. Open source. Блог компании ИТМО. искусственный интеллект. китай.. deepseek. Open source. Блог компании ИТМО. искусственный интеллект. китай. Программирование.. deepseek. Open source. Блог компании ИТМО. искусственный интеллект. китай. Программирование. проекты.. deepseek. Open source. Блог компании ИТМО. искусственный интеллект. китай. Программирование. проекты. сезон open source.

В начале этого года весь мир обсуждал DeepSeek. Это только первая ласточка и верхушка айсберга результатов работы системы поддержки open source в Китае. Уже очень скоро их системный подход начнет приносить интересные результаты. 

О преимуществах и особенностях китайского подхода к развитию open source на Scientific Open source Meetup 2025, организованном при участии ИТМО, GitVerse и OpenScaler, рассказывал Олег Сиротюк, лидер сообщества OpenScaler. Та же тема активно обсуждалась во время круглого стола. В этой статье пересказываем основные идеи обсуждения.

Scientific Open source Meetup 2025 в Петербурге

Scientific Open source Meetup 2025 в Петербурге

Феномен DeepSeek

Кажется, сегодня все знают, что такое DeepSeek. Эта большая языковая модель буквально взорвала мир. Ее выпустила небольшая китайская компания, которая была создана в 2020 году. Причем, это не крупный холдинг, не государственная инициатива, а полноценный стартап, в который инвестировал человек, верящий в искусственный интеллект. Компания состоит из людей, которые родились, учились и работали только в Китае. Там нет ни одного специалиста, который получал бы образование на Западе.

Компания выпускала свои модели на протяжении трех лет, но в конце прошлого ― начале этого года они стали известны на весь мир. Сначала в декабре 2024 появился DeepSeek v3 ― LLM, которая по своим характеристикам не уступает основным западным аналогам. А в начале этого года вышел DeepSeek R1 ― рассуждающая модель, которая обрушила акции NVidia, поскольку китайцы заявили, что для обучения и использования модели требуется на порядок меньше ресурсов. Они смогли разработать такие оптимизационные механизмы, которые позволили обучать модели и использовать их на куда меньшем объеме железа (в 10 раз меньше NVidia).

Но самое важное: DeepSeek не планирует закрывать свой код. Наоборот, они выкладывают все исходные коды и веса в открытый доступ ― это полноценный open source.

Естественно, феномен DeepSeek тут же начали анализировать западные коллеги. Ян Лекун, вице-президент компании Meta (признана в России экстремистской организацией и запрещена) и лауреат премии Тьюринга, высказался, что дело не в победе китайской нейросети над американской. По его мнению, суть в том, что открытые модели победили закрытые. Через некоторое время это мнение подтвердил Сэм Альтман, генеральный директор компании OpenAI. Дело в том, что до GPT3 OpenAI также выпускал открытые модели, но начиная с третьей версии продукт был закрыт. Специалист признался, что, судя по успеху DeepSeek, компания оказалась не с той стороны истории. 

Иными словами, именно открытый исходный код ― основной драйвер революции в экосистеме искусственного интеллекта. И DeepSeek тому хорошее подтверждение.

Open source имеет ряд неоспоримых преимуществ:

  • Границы стираются. Любой человек, размещая свой проект, может рассчитывать, что к нему подключатся люди со всего мира. Мы не ограничены в развитии одной компанией.

  • Технологии для всех. Возможность загрузить код, улучшить его, запустить и получить результат вдохновляет людей.

  • Скорость прогресса. Open source помогает консолидировать серьезный интеллектуальный потенциал в одном проекте. Благодаря этому мы получаем результаты быстро ― намного быстрее, чем в случае одной команды, даже если это OpenAI с его невероятными бюджетами.

Получается, DeepSeek ― не чудо, а закономерный результат выстроенной в Китае системы поддержки open source проектов в области искусственного интеллекта.

Как организована такая поддержка

В 2020 году в ответ на западные санкции против Huawei крупные китайские компании при поддержке государства создали фонд OpenAtom. Правительство страны задумалось о том, насколько глубоко китайская ИТ-индустрия зависит от американских технологий. И на тот момент зависимость была довольно высокой, что побудило начать процесс импортозамещения, в том числе железа и open source. Фонд OpenAtom стал одной из инициатив в рамках этого импортозамещения. Помимо государства в нем участвуют донатами крупные компании.

Перед фондом поставили две основные задачи:

  • Поддержать развитие ключевых для Китая проектов ― ОС, БД, моделей ИИ и так далее ― тех, которые нельзя сделать в одиночку, где нужно сосредоточение усилий, чтобы реализовать все быстро и относительно дешево.

  • Выстроить систему подготовки специалистов буквально с уровня школы и студенчества. 

По обоим направлениям за прошедшие годы OpenAtom продвинулся достаточно далеко.

Фонд курирует обучение школьников и студентов ― им рассказывают, что такое open source, как организована работа внутри и какие выгоды для себя можно получить с его помощью. Параллельно он помогает командам молодых специалистов развивать open source проекты ― дает для этого все необходимые ресурсы, предоставляет множество сервисов, закрывающих те вопросы, которыми разработчики обычно не хотят заниматься: обеспечивает юридическую поддержку, организует мероприятия, выстраивает сообщество и тому подобное. При этом он, естественно, контролирует целевое расходование средств.

Проекты в области искусственного интеллекта не могут развиваться без вычислительных мощностей. Чтобы сделать их доступнее, китайцы запустили сеть так называемых центров коллективного использования. Это очень крупные вычислительные центры ― порядка петафлопс и даже экзафлопс ― где мощности датируются государством, то есть предоставляются желающим практически бесплатно. На этих мощностях молодые компании могут тестировать свои проекты и гипотезы.

Импортозамещается в Китае не только open source, но и железо, точнее железо NVidia ― это история уже за рамками фонда OpenAtom. Одна из ключевых компаний, которая обеспечивает это импортозамещение, ― Huawei, выпускающая чипы Ascent, линейку продуктов Atlas. И на сегодняшний день уже каждые три чипа из четырех в Китае выпущены этой компанией.

Понятно, что для китайских игроков их собственная аппаратная платформа в приоритете. Это касается не только моделей ИИ, но и в целом open source проектов, например openEuler ― ключевого дистрибутива Linux в Китае с сообществом более 20 тыс. участников и 1800 коммерческих организаций.

Основные ИИ-игроки в Китае

При таких начальных данных стоит ожидать результаты ― очень внимательно следить за тем, что происходит в области искусственного интеллекта в Китае, в ближайшее время там будет много всего интересного.

DeepSeek ― только первая ласточка:

Qwen ― целая линейка моделей, разработанная корпорацией Alibaba. Это одни из мощнейших моделей ИИ в Китае, которые выкладываются на GitHub. Они первые поддержали миллион токенов (то есть слов, которые может сформулировать нейросеть).

Кстати, Qwen уже очень популярна в России. Т-Банк выпустил свою модель на ее основе.

MoonshotAI ― очень интересный стартап, напоминающий DeepSeek. Его основной продукт ― Kimi. Из перечисленных проектов этот пока единственный, кто умеет переваривать веб-ссылки. Модель можно попросить, например сделать обзор на статью.

ByteDance ― это компания, которая сделала TikTok. И хотя их выгнали из США, в Китае это основная соцсеть под названием DaoBao. Помимо своей социальной сети, ByteDance активно развивает самые разнообразные нейромодели. Это как LLM, так и генерация видео, картинок и работа со звуком. Интересны они тем, что у них огромный «молодежный» датасет, собранный с TikTok, и внушительная клиентская база.

В прошлом году по показателю MAO (monthly active users, количество активных пользователей в месяц) DaoBao была на первом месте в Китае с более 15 млн. пользователей.

Можно также отдельно выделить экосистему Modelers, созданную компанией Huawei (построенную на ее вычислительных мощностях). Так или иначе все китайские компании поддерживают эту экосистему в приоритетном порядке, поскольку речь идет о железе собственного производства.

У Modelers есть хороший англоязычный интерфейс, много quick start документации, бесплатная регистрация, песочницы.

Вместо итогов

Мир open source сейчас позволяет попробовать разные сетки. Экспериментируйте и развивайте свои идеи.

Исследуйте чужие open source проекты. И не надо смущаться того, что это действительно большие языковые модели. DeepSeek ― это 670 млрд токенов, но не надо думать, что никогда не найдется достаточно вычислительных мощностей для работы с подобными сетями. Обратите внимание на три термина:

  • дистилляция;

  • сериализация;

  • merge kit.

Это тренды в мире искусственного интеллекта. Многие компании сейчас работают над тем, чтобы запускать нейросети на достаточно скромном оборудовании, добиваясь при этом хороших результатов.

Еще одна рекомендация ― Ollama ― это простой инструмент, который позволяет развернуть нейросеть на вашем локальном компьютере, обращаясь к ней как к веб-серверу.

Дополнительные материалы

Про опенсорс в ИТМО

Канал и чат про научный опенсорс в Telegram: @scientific_opensource

Автор: itmo

Источник

Рейтинг@Mail.ru
Rambler's Top100