Флаг Китая и экран телефона с приложением DeepSeek, приветствующим пользователя.

Что ждет китайский ИИ с открытым исходным кодом в будущем?

Китайские открытые модели быстро распространяются, от Hugging Face до Силиконовой долины. Вот почему это важно.

На этой фотоиллюстрации приложение DeepSeek изображено на телефоне на фоне флага Китая 28 января 2025 года в Гонконге, Китай.
На этой фотоиллюстрации приложение DeepSeek изображено на телефоне на фоне китайского флага 28 января 2025 года в Гонконге, Китай. Фото: Энтони Кван/Getty.

Прошедший год стал поворотным моментом для китайского ИИ. С момента выпуска компанией DeepSeek своей модели логического мышления R1 в январе 2025 года китайские компании неоднократно создавали модели ИИ, которые по производительности соответствуют ведущим западным моделям, но при этом обходятся значительно дешевле.

Буквально на прошлой неделе китайская компания Moonshot AI выпустила свою новейшую модель с открытым исходным кодом, Kimi K2.5, которая в некоторых предварительных тестах приблизилась к лучшим проприетарным системам, таким как Claude Opus от Anthropic. Разница: K2.5 стоит примерно в семь раз дешевле, чем Opus.

На платформе Hugging Face семейство моделей Qwen от Alibaba, после того как в 2025 и 2026 годах занимало первое место по количеству загрузок, обогнало модели Llama от Meta по общему числу загрузок. А недавнее исследование Массачусетского технологического института показало, что китайские модели с открытым исходным кодом превзошли американские модели по общему количеству загрузок. Для разработчиков и создателей по всему миру доступ к практически передовым возможностям искусственного интеллекта никогда не был таким широким и доступным.

Эти модели принципиально отличаются от большинства американских моделей, таких как ChatGPT или Claude, за доступ к которым нужно платить, но проверить их содержимое невозможно. Китайские компании публикуют веса своих моделей — числовые значения, которые устанавливаются в процессе обучения модели, — поэтому любой желающий может скачать, запустить, изучить и модифицировать их.

Если модели ИИ с открытым исходным кодом будут постоянно совершенствоваться, они не просто предложат самые дешевые варианты для тех, кто хочет получить доступ к передовым возможностям ИИ; они изменят то, где происходят инновации и кто устанавливает стандарты.

Вот что может произойти дальше.

Китай продолжит придерживаться принципов открытого исходного кода.

Когда DeepSeek выпустила R1, первоначальный шок был связан с её происхождением. Внезапно китайская команда представила модель логического мышления, которая могла бы конкурировать с лучшими системами из американских лабораторий. Но влияние DeepSeek имело большее значение, чем распространение, и заключалось не столько в национальной принадлежности. R1 была выпущена как модель с открытыми весами под разрешительной лицензией MIT, позволяющей любому желающему загрузить, изучить и развернуть её. Кроме того, DeepSeek опубликовала статью, подробно описывающую процесс обучения и методы. Для разработчиков, получающих доступ к моделям через API, DeepSeek также предлагала более низкие цены, чем конкуренты, предоставляя доступ по цене, значительно меньшей, чем у OpenAI o1, ведущей на тот момент проприетарной модели логического мышления.

Спустя несколько дней после выхода DeepSeek обогнал ChatGPT и стал самым скачиваемым бесплатным приложением в американском App Store. Этот момент вывел компанию за пределы круга разработчиков и затронул финансовые рынки, вызвав резкое падение акций американских технологических компаний, которое на короткое время обнулило рыночную капитализацию примерно в 1 триллион долларов. Практически за одну ночь DeepSeek превратился из малоизвестной дочерней компании, поддерживаемой количественным хедж-фондом, в самый заметный символ стремления Китая к развитию искусственного интеллекта с открытым исходным кодом.

Решение Китая сделать ставку на открытый исходный код не вызывает удивления. В стране сосредоточено второе по величине в мире количество специалистов по искусственному интеллекту после США, а также обширная и хорошо развитая технологическая индустрия. После того, как ChatGPT стал широко известен, китайский сектор ИИ пережил период переосмысления и вышел из него с решимостью наверстать упущенное. Стратегия использования открытого исходного кода рассматривалась как самый быстрый способ сократить отставание за счет объединения разработчиков, распространения внедрения и установления стандартов.

Как DeepSeek перевернул правила игры в сфере искусственного интеллекта — и почему все последуют его примеру. Читайте далее.

Успех DeepSeek вселил уверенность в отрасль, долгое время привыкшую следовать мировым стандартам, а не устанавливать их. «Тридцать лет назад ни один китаец не поверил бы, что он может оказаться в центре глобальных инноваций», — говорит Алекс Ченглин Ву, генеральный директор и основатель Atoms, компании, занимающейся разработкой ИИ-агентов и являющейся видным участником китайской экосистемы открытого исходного кода. «DeepSeek показывает, что при наличии высококвалифицированных технических специалистов, благоприятной среды и правильной организационной культуры можно создавать действительно первоклассные разработки».

Прорыв DeepSeek не был первым успехом китайского проекта с открытым исходным кодом. Лаборатория Qwen компании Alibaba выпускала модели с открытым исходным кодом в течение многих лет. К сентябрю 2024 года, задолго до запуска DeepSeek V3, Alibaba заявляла, что количество загрузок по всему миру превысило 600 миллионов. На платформе Hugging Face на долю Qwen приходилось более 30% всех загрузок моделей в 2024 году. Другие учреждения, включая Пекинскую академию искусственного интеллекта и компанию Baichuan, также начали выпускать модели с открытым исходным кодом еще в 2023 году.

Но после успеха DeepSeek эта область быстро расширилась. Такие компании, как Z.ai (ранее Zhipu), MiniMax, Tencent и растущее число небольших лабораторий, выпустили модели, конкурентоспособные в задачах логического мышления, программирования и задачах, аналогичных задачам агентов. Рост числа перспективных моделей ускорил прогресс. Возможности, которые раньше появлялись в открытом доступе лишь через несколько месяцев, теперь возникают за недели, а то и за дни.

«Китайские компании, занимающиеся искусственным интеллектом, получили реальную выгоду от использования открытого исходного кода», — говорит Лю Чжиюань, профессор компьютерных наук в Университете Цинхуа и главный научный сотрудник стартапа ModelBest, занимающегося разработкой ИИ. «Публикуя результаты качественных исследований, они укрепляют свою репутацию и получают бесплатную рекламу».

Помимо коммерческих стимулов, говорит Лю, открытый исходный код приобрел культурное и стратегическое значение. «В китайском сообществе программистов открытый исходный код стал политически корректным», — говорит он, рассматривая это как ответ на доминирование США в проприетарных системах искусственного интеллекта.

Этот сдвиг отражается и на институциональном уровне. Университеты, включая Цинхуа, начали поощрять разработку ИИ и вклад в проекты с открытым исходным кодом, а политики приступили к формализации этих стимулов. В августе Государственный совет Китая опубликовал проект политики, призывающий университеты вознаграждать работу над проектами с открытым исходным кодом, предлагая в конечном итоге учитывать вклад студентов на таких платформах, как GitHub или Gitee, в качестве академических кредитов.

По словам Тьечжэнь Ван, руководителя глобальной работы над ИИ в Hugging Face, стремление Китая к использованию моделей с открытым исходным кодом, вероятно, продолжится в ближайшей перспективе, хотя его долгосрочная устойчивость по-прежнему зависит от финансовых результатов. В январе лаборатории моделей Z.ai и MiniMax провели первичное публичное размещение акций в Гонконге. «Сейчас основное внимание уделяется увеличению доли рынка», — говорит Ван. «Следующая задача — выяснить, как каждая компания обеспечит себе свою долю».

Следующее поколение моделей будет более узким — и лучшим.

Китайские модели с открытым исходным кодом лидируют не только по объему загрузок, но и по разнообразию. Qwen от Alibaba стала одним из самых разнообразных семейств открытых моделей, предлагая широкий спектр вариантов, оптимизированных для различных задач. Линейка включает в себя как легкие модели, работающие на одном ноутбуке, так и крупные системы с сотнями миллиардов параметров, предназначенные для развертывания в центрах обработки данных. Qwen предлагает множество оптимизированных для конкретных задач вариантов, созданных сообществом: модели «instruct» хорошо справляются с выполнением команд, а варианты «code» специализируются на программировании.

Хотя эта стратегия не уникальна для китайских лабораторий, Qwen стала первым семейством продуктов с открытой моделью, которое предложило так много высококачественных опций, что стало ощущаться как полноценная линейка продуктов — бесплатная в использовании.

Открытая структура этих релизов также облегчает их адаптацию другими разработчиками с помощью таких методов, как тонкая настройка и дистилляция, то есть обучение меньшей модели для имитации большей. Согласно ATOM (American Truly Open Models), проекту исследователя ИИ Натана Ламберта, к 4 августа 2025 года новые варианты моделей, полученные на основе Qwen, составляли «более 40%» новых производных языковой модели Hugging Face, в то время как доля Llama упала примерно до 15%. Это означает, что Qwen стала базовой моделью по умолчанию для всех «ремиксов».

Эта тенденция обосновала необходимость создания более компактных и специализированных моделей. «Вычислительные мощности и энергопотребление являются реальными ограничениями для любого развертывания», — говорит Лю. В интервью MIT Technology Review он заявил, что рост популярности небольших моделей связан с тем, чтобы сделать ИИ дешевле в эксплуатации и проще в использовании для большего числа людей. Его компания, ModelBest, специализируется на небольших языковых моделях, предназначенных для локальной работы на таких устройствах, как телефоны, автомобили и другое потребительское оборудование.

В то время как обычный пользователь может взаимодействовать с ИИ только через веб-браузер или приложение для простых разговоров, опытные пользователи моделей ИИ с определенным техническим опытом экспериментируют с предоставлением ИИ большей автономии для решения крупномасштабных задач. OpenClaw, агент ИИ с открытым исходным кодом, который недавно стал вирусным в мире хакеров, занимающихся ИИ, позволяет ИИ взять под контроль ваш компьютер — он может работать круглосуточно, просматривая вашу электронную почту и выполняя рабочие задачи без вашего участия.

Moltbook был вершиной театрального искусства с использованием ИИ. Читайте далее.

OpenClaw, как и многие другие инструменты с открытым исходным кодом, позволяет пользователям подключаться к различным моделям ИИ через программный интерфейс приложений (API). Через несколько дней после выпуска OpenClaw команда разработчиков сообщила, что модель K2.5 от Kimi превзошла Claude Opus и стала самой используемой моделью ИИ — по количеству токенов, то есть обрабатывала больше текста, включая запросы пользователей и ответы модели.

Стоимость стала одной из главных причин популярности китайских моделей, но было бы ошибкой рассматривать их как простые «копии» западных передовых систем, считает Ван. Как и любой продукт, модель должна быть достаточно хороша для выполнения поставленной задачи.

В Китае ландшафт моделей с открытым исходным кодом также становится все более специализированным. Исследовательские группы, такие как Шанхайская лаборатория искусственного интеллекта, выпустили модели, ориентированные на научные и технические задачи; несколько проектов от Tencent были сосредоточены именно на генерации музыки. Ubiquant, компания, занимающаяся количественными финансами, подобная High-Flyer, материнской компании DeepSeek, выпустила открытую модель, предназначенную для медицинского анализа.

Тем временем инновационные архитектурные идеи из китайских лабораторий получают все более широкое распространение. Компания DeepSeek опубликовала работы, посвященные эффективности моделей и использованию памяти; методы, которые сжимают «кэш» внимания модели, уменьшая затраты памяти и на вывод данных при сохранении в основном производительности, привлекли значительное внимание исследовательского сообщества.

«Влияние этих научных прорывов усиливается, потому что они имеют открытый исходный код и могут быть быстро внедрены во всей области», — говорит Ван.

Китайские открытые модели станут инфраструктурой для глобальных разработчиков ИИ.

Внедрение китайских моделей набирает обороты и в Силиконовой долине. Мартин Касадо, генеральный партнер Andreessen Horowitz, привел конкретные цифры: по его сообщению на X, среди стартапов, представляющих свои проекты с открытым исходным кодом, примерно в 80% случаев используются китайские открытые модели. Данные об использовании подтверждают эту тенденцию. OpenRouter, посредник, отслеживающий использование различных моделей ИИ через свой API, показывает, что доля китайских открытых моделей выросла с почти нулевого уровня в конце 2024 года до почти 30% в последние недели.

Спрос растет и в глобальном масштабе. Компания Z.ai ограничила количество новых подписок на свой план кодирования GLM (инструмент кодирования, основанный на ее флагманских моделях GLM) после резкого роста спроса, сославшись на ограничения вычислительных мощностей. Примечательно, откуда поступает спрос: по данным CNBC, основная база пользователей системы сосредоточена в США и Китае, за которыми следуют Индия, Япония, Бразилия и Великобритания.

«Экосистемы открытого исходного кода в Китае и США тесно связаны между собой», — говорит Ван из Hugging Face. Многие китайские открытые модели по-прежнему зависят от Nvidia и американских облачных платформ для обучения и обслуживания, что усложняет деловые связи. Талант также изменчив: исследователи перемещаются между странами и компаниями, и многие по-прежнему работают как глобальное сообщество, публично обмениваясь кодом и идеями.

Эта взаимозависимость отчасти и вселяет оптимизм в китайских разработчиков: их работы распространяются, перерабатываются и действительно находят применение в продуктах. Но открытость также может ускорить конкуренцию. Дарио Амодей, генеральный директор Anthropic, высказал аналогичную точку зрения после релизов DeepSeek в 2025 году: он написал, что экспортный контроль — это «не способ уклониться от конкуренции» между США и Китаем, и что американские компании, занимающиеся ИИ, «должны иметь лучшие модели», если хотят добиться успеха.

В течение последнего десятилетия история китайских технологий на Западе была историей больших ожиданий, которые сталкивались с пристальным вниманием, ограничениями и политическим противодействием. На этот раз экспорт — это не просто приложение или потребительская платформа. Речь идёт о базовом уровне модели, на основе которого строятся другие. Будет ли ситуация развиваться иначе, пока остаётся открытым вопросом.

Источник: www.technologyreview.com

✅ Найденные теги: Будущее, ИИ, Китайский, новости, Открытый Исходный Код, Что

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.
Спутник исследует черную дыру в космосе, испускающий световой луч.
Пикачу использует электрический разряд на фоне неба.
Черный углеродное волокно с текстурой плетения, отражающий свет.
Круглый экран с изображением замка и горы, рядом электронная плата.
Код на экране компьютера, программирование, интерфейс разработчика.
Статистика использования видеокарт NVIDIA RTX, показывающая изменения за октябрь-февраль.
Макросъемка клетки под микроскопом, текстура и форма на голубом фоне.
Image Not Found
Звёздное небо с галактиками и туманностями, космос, Вселенная, астрофотография.

Система оповещения обсерватории Рубина отправила 800 000 сигналов в первую ночь наблюдений.

Астрономы будут получать оповещения о небесных явлениях в течение нескольких минут после их обнаружения. Теренс О'Брайен, редактор раздела «Выходные». Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной…

Мар 2, 2026
Женщина с длинными тёмными волосами в синем свете, нейтральный фон.

Расследование в отношении 61-фунтовой машины, которая «пожирает» пластик и выплевывает кирпичи.

Обзор компактного пресса для мягкого пластика Clear Drop — и что будет дальше. Шон Холлистер, старший редактор Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего…

Мар 2, 2026
Черный углеродное волокно с текстурой плетения, отражающий свет.

Материал будущего: как работает «бессмертный» композит

Учёные из Университета штата Северная Каролина представили композит нового поколения, способный самостоятельно восстанавливаться после серьёзных повреждений.  Речь идёт о модифицированном армированном волокном полимере (FRP), который не просто сохраняет прочность при малом весе, но и способен «залечивать» внутренние…

Мар 2, 2026
Круглый экран с изображением замка и горы, рядом электронная плата.

Круглый дисплей Waveshare для креативных проектов

Круглый 7-дюймовый сенсорный дисплей от Waveshare создан для разработчиков и дизайнеров, которым нужен нестандартный экран.  Это IPS-панель с разрешением 1 080×1 080 пикселей, поддержкой 10-точечного ёмкостного сенсора, оптической склейкой и защитным закалённым стеклом, выполненная в круглом форм-факторе.…

Мар 2, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых