Open-source ИИ побеждает не там, где вы думаете

05.07.2026 ideipro.ru

Все спорят про бенчмарки: обошёл ли GLM-5.2 Opus в кодинге, где Qwen на LiveCodeBench, кто выше в Artificial Analysis Index. Спор красивый, но пустой. Потому что настоящая победа китайского open-source происходит не в таблицах лидербордов, а в местах, куда журналисты обычно не смотрят: в проде реальных компаний, в закупках госсектора и в строчке бюджета «расходы на токены». И там расклад совсем не такой, как на сцене презентаций.

Разберём, где именно открытые китайские модели уже вытесняют закрытые американские — и почему это происходит не потому, что они «лучше».

Парадокс: интеллект и использование разъехались

Начнём с факта, который ломает всю логику «лучшая модель побеждает». По данным Q2-отчёта о рынке китайских моделей (это регулярный аналитический обзор рынка, который сводит воедино данные по десятке ключевых китайских провайдеров — Qwen, GLM, DeepSeek, Kimi, MiniMax и другим — с разбивкой по объёму использования, лицензиям и корпоративному внедрению), самые ходовые модели на OpenRouter не входят в топ-10 по «интеллекту». MiMo-V2-Pro от Xiaomi — модель №1 по объёму использования на платформе, но по индексу интеллекта она примерно десятая.

Цифры сдвига впечатляют. Год назад китайские провайдеры занимали меньше 2% трафика OpenRouter. К апрелю 2026 совокупная доля Xiaomi, Alibaba, MiniMax, Zhipu, DeepSeek и StepFun превысила 45% недельного объёма. Один только Xiaomi обрабатывает около 4,2 трлн токенов в неделю — это втрое больше доли OpenAI.

При этом — и вот важная деталь для трезвости — по данным MIT Sloan (школа менеджмента при Массачусетском технологическом институте; её исследователи проанализировали статистику использования моделей на OpenRouter), закрытые модели всё ещё дают порядка 80% использования по деньгам, стоя при этом в шесть раз дороже. То есть картина не «китайцы победили», а «китайцы захватили тот слой рынка, где люди считают деньги». А таких людей становится всё больше.

Кейс 1. Airbnb: 13 моделей, а «полагаемся сильно» — на китайскую

Open-source ИИ побеждает не там, где вы думаете

Самый показательный пример — не стартап-энтузиаст, а публичная компания. CEO Airbnb Брайан Чески открыто сказал, что их ИИ-агент поддержки построен на 13 разных моделях, включая OpenAI и Google, но в проде компания «полагается в основном» на Qwen от Alibaba. Формулировка Чески: модель «очень хорошая, к тому же быстрая и дешёвая». Про модели OpenAI он сказал прямо: их держат, но «в проде используют не так много, потому что есть быстрее и дешевле».

Обратите внимание на механику вытеснения. Никто не выкинул американские модели одним указом. Их просто оставили как бэкап и запасной вариант «на будущее», а весь боевой трафик увёл на открытую китайскую. Это и есть реальное вытеснение — не в пресс-релизе, а в роутинге.

Кейс 2. Европейская промышленность: Siemens и Renault страхуются от рубильника

Второй кейс интереснее геополитически. После того как США по соображениям нацбезопасности ограничили доступ к моделям Anthropic, крупные европейские корпорации ускорили диверсификацию. На VivaTech в Париже (крупнейшая в Европе технологическая выставка-конференция, куда съезжаются стартапы, корпорации и инвесторы со всего мира) руководители Siemens, Renault и Orange прямо заявили, что переходят на гибридную мульти-модельную стратегию: американское + китайское + европейское.

Siemens официально раскрыл свой «реестр моделей» — рядом с американскими и европейскими там теперь DeepSeek, Qwen и Nvidia Nemotron. Renault собирает похожий зоопарк: от Google, Microsoft и французского Mistral до DeepSeek. Логика не в том, что китайская модель «умнее». Логика — в устойчивости. CEO Siemens Digital Industries сформулировал так: «Нужна гибкость». Французская ChapsVision выразилась ещё резче: смысл суверенитета — иметь под рукой рабочую альтернативу на случай, когда критичный сервис отключат.

Кейс 3. Токен-бюджеты: как агенты сожгли годовой лимит за 4 месяца

Вот двигатель, который толкает всех троих. Как только компании начали внедрять агентов, которые сами гоняют цепочки вызовов, потребление токенов начало расти экспоненциально. Пример, который приводят европейцы: Uber, по сообщениям, выжег весь годовой бюджет на токены за четыре месяца. Orange заявила, что её топ-менеджмент до конца года будет «одержим стоимостью за токен».

Теперь посчитаем, почему это приговор для дорогих закрытых моделей на массовых задачах. DeepSeek-V4-Pro стоит $1,74 за миллион входных токенов и $3,48 за выходные. Для сравнения: Gemini 3.1 Pro — $2 / $12, GPT-5.5 — $5 / $30, Claude Opus 4.7 — $5 / $25. Как выразился аналитик RPA2AI Research, «цена — треть от того, что берут фронтир-лаборатории», и «такая цена меняет покупательское поведение». Он же добавил мысль, которая и есть суть всей статьи: даже если китайская модель отстаёт от фронтира на три-шесть месяцев, это отставание не имеет значения, если разрыв в цене кратный.

Для агента, который делает тысячи вызовов ради одной задачи, разница в цене превращается в разницу между «внедряем» и «не можем себе позволить». А качество «достаточно хорошее» перекрывает потребность в «самом лучшем».

Кейс 4. Суверенный ИИ: Сингапур и Малайзия выбрали китайское

Ещё один слой, невидимый из мира лидербордов, — государственные закупки. Правительство Сингапура выбрало Qwen, а не Llama от Meta, чтобы строить свою суверенную региональную модель. Малайзия объявила, что её суверенная ИИ-экосистема будет работать на китайских open-weight моделях.

Почему? Для страны, строящей собственный ИИ-стек, важнее не бенчмарк, а возможность скачать веса, запустить у себя, изучить и дообучить без спроса. GLM-5 здесь особенно показателен: он обучается и работает end-to-end на китайском кремнии Huawei Ascend и выходит под лицензией MIT. Для государственного или экспортно-чувствительного покупателя аппаратная независимость стоит дороже одного пункта в бенчмарке.

И география спроса это подтверждает. По данным Microsoft, доля DeepSeek достигала оценочных 56% в Беларуси, 49% на Кубе, 43% в России, с сильными позициями в Сирии, Иране и ряде африканских стран. Там, где западные сервисы недоступны или ограничены, «открытый и дешёвый» побеждает по умолчанию — просто потому, что доступен.

Где эта картина ломается:

Было бы нечестно закончить на этом, у этого сюжета есть жёсткая обратная сторона, и без неё статья была бы пропагандой.

Регулируемые отрасли не пускают китайские модели в принципе. Аналитики прямо предупреждают: многие клиенты в банкинге и кибербезопасности в ЕС и США не примут китайскую модель в стек независимо от цены и бенчмарков. Enterprise-миграции длятся месяцами. Именно поэтому вероятный исход — «частичный роутинг», а не тотальная замена: несекретные задачи уходят на дешёвую открытую модель, чувствительные остаются на проверенном закрытом стеке.

Политическое давление нарастает. В апреле палата представителей США запустила расследование против Airbnb и Anysphere (материнская компания Cursor) именно из-за использования китайских моделей. Cursor попал под удар после того, как независимый разработчик обнаружил, что их модель Composer 2 построена на системах Moonshot AI. Использование китайской модели в проде теперь несёт не только техническую, но и политическую стоимость.

Цензура зашита в веса. Тестирование DeepSeek показало высокий процент отказов и смещение по геополитическим темам — по одной из оценок, около 88% ответов демонстрировали цензуру на чувствительных вопросах. Для чат-бота поддержки Airbnb это неважно. Для медиа, аналитики или образования — критично.

И даже в суверенном ИИ Llama пока впереди. По индексу CNAS, среди проектов на открытых весах Llama от Meta остаётся явным фаворитом (около 36% проектов), и лишь потом идут Mistral, Gemma и Qwen. То есть американский open-source (пока он ещё есть) держит позицию — просто американские лаборатории массово уходят в закрытые модели, освобождая поле.

Сложите картину вместе, и вырисовывается не «Китай обогнал США», а кое-что важнее для инженера, который завтра выбирает стек.

Победа open-source происходит на оси «цена × контроль × доступность», а не на оси «максимальный интеллект». Там, где задача массовая, токенов много, а данные не супер-чувствительные — открытая китайская модель уже выигрывает по совокупности, и Airbnb это доказал в проде. Там, где нужен фронтир на сложном рассуждении, регуляторика или политическая чистота — закрытые американские модели держатся, и подороже.

Практический вывод, который уже стал индустриальным паттерном: не «какая модель лучшая», а «какую модель на какую задачу роутить». Кодинг — на одну, tool calls — на другую, длинные документы — на третью, чувствительное — на закрытую. Мульти-модельный роутинг из экзотики превратился в дефолт, и именно он, а не победа одного флагмана, и есть реальный итог 2026 года.

А спор про бенчмарки можно оставить сцене презентаций. Деньги считают в другом месте.

Больше про LLM и AI — в нашем Telegram-канале (@devgeek_sh). Разбираем новые модели, делимся опытом и полезными находками.

Источник: vc.ru

Оцените материал:

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Что это значит на практике

Похожие записи

Похожие записи

Давайте узнаем о жуткой «темной энергии’

«Реальность на кону: Как игры объясняют человеческую природу». Почему SimCity нельзя воспринимать всерьез

КОТ ШРЁДИНГЕРА — ЭТО РЕАЛЬНОСТЬ, А НЕ РОМАШКА В ЖOПE

Оставить комментарий Отменить ответ

Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email