Карл Франзен

Китайский стартап в области искусственного интеллекта Z.ai, известный своим мощным семейством больших языковых моделей (LLM) с открытым исходным кодом, представил GLM-5-Turbo, новый, запатентованный вариант своей модели GLM-5 с открытым исходным кодом, предназначенный для рабочих процессов, управляемых агентами. Компания позиционирует его как более быструю модель, оптимизированную для задач в стиле OpenClaw, таких как использование инструментов, выполнение длинных цепочек и постоянная автоматизация.
Теперь он доступен через программный интерфейс (API) Z.ai на стороннем провайдере OpenRouter с контекстным окном примерно в 202,8 тыс. токенов, максимальным выходным объемом 131,1 тыс. токенов и заявленной ценой в 0,96 доллара за миллион входных токенов и 3,20 доллара за миллион выходных токенов. По нашим расчетам, это примерно на 0,04 доллара дешевле в пересчете на общие входные и выходные затраты (при объеме в 1 миллион токенов), чем у его предшественника.
Модель | Вход | Выход | Общая стоимость | Источник |
Grok 4.1 Fast | 0,20 доллара | 0,50 доллара | 0,70 доллара | xAI |
Gemini 3 Flash | 0,50 доллара | 3,00 доллара | 3,50 доллара | |
Кими-К2.5 | 0,60 доллара | 3,00 доллара | 3,60 доллара | Лунный выстрел |
GLM-5-Turbo | 0,96 доллара | 3,20 доллара | 4,16 доллара | OpenRouter |
ГЛМ-5 | 1,00 долл. | 3,20 доллара | 4,20 доллара | З.ай |
Клод Хайку 4.5 | 1,00 долл. | 5,00 долларов | 6,00 долларов | Антропический |
Qwen3-Max | 1,20 доллара | 6,00 долларов | 7,20 долларов | Alibaba Cloud |
Gemini 3 Pro | 2,00 доллара | 12,00 долларов | 14,00 долларов | |
ГПТ-5.2 | 1,75 доллара | 14,00 долларов | 15,75 долларов | OpenAI |
ГПТ-5.4 | 2,50 доллара | 15,00 долларов | 17,50 долларов | OpenAI |
Клод Сонет 4.5 | 3,00 доллара | 15,00 долларов | 18,00 долларов | Антропический |
Клод Опус 4.6 | 5,00 долларов | 25,00 долларов | 30,00 долларов | Антропический |
GPT-5.4 Pro | 30,00 долларов | 180,00 долларов США | 210,00 долларов США | OpenAI |
Во-вторых, Z.ai также добавляет эту модель в свой подписной продукт GLM Coding, который представляет собой готовый сервис помощи в программировании. Этот сервис имеет три уровня: Lite за 27 долларов в квартал, Pro за 81 доллар в квартал и Max за 216 долларов в квартал.
В сообщении Z.ai от 15 марта о начале продаж говорится, что подписчики Pro получат GLM-5-Turbo в марте, а подписчики Lite — базовую версию GLM-5 в марте, а GLM-5-Turbo им придётся ждать до апреля. Компания также принимает заявки на ранний доступ для корпоративных клиентов через форму Google, что предполагает, что некоторые пользователи могут получить доступ раньше указанного срока в зависимости от наличия ресурсов.
Компания z.ai описывает GLM-5-Turbo как алгоритм, разработанный для «быстрого вывода» и «глубоко оптимизированный для реальных рабочих процессов агентов, включающих длинные цепочки выполнения», с улучшениями в декомпозиции сложных инструкций, использовании инструментов, запланированном и постоянном выполнении, а также стабильности при выполнении длительных задач.
Этот релиз предлагает разработчикам новый вариант для создания автономных агентов искусственного интеллекта в стиле OpenClaw и служит сигналом о том, куда, по мнению поставщиков моделей, движется корпоративный спрос: от чат-интерфейсов к системам, способным надежно выполнять многоэтапную работу.
Сейчас значительная часть конкуренции смещается именно в этом направлении, особенно среди поставщиков, стремящихся привлечь разработчиков и корпоративные команды, создающие внутренних ассистентов, оркестраторов рабочих процессов и агентов для программирования.
Создано для реализации, а не просто для обсуждения.
В материалах Z.ai модель GLM-5-Turbo представлена как модель поведения агентов, имитирующая производственный процесс, а не как статическое использование в режиме «запрос-ответ».
Основной упор делается на надежность в практических задачах: улучшенное выполнение команд, более надежный вызов инструментов, улучшенная обработка запланированных и постоянных задач, а также более быстрое выполнение в более длинных логических цепочках. Такое позиционирование выводит модель на рынок агентов, которые делают больше, чем просто отвечают на вопросы.
Она предназначена для систем, способных собирать информацию, вызывать инструменты, разбивать инструкции и продолжать работу над сложными последовательностями задач с минимальным контролем.
Вместо того чтобы быть прямым преемником GLM-5, GLM-5-Turbo, по-видимому, представляет собой более ориентированный на производительность вариант: оптимизированный для скорости, использования инструментов и стабильности длинных цепочек агентов, в то время как базовая версия GLM-5 остается флагманской открытой разработкой Z.ai.
GLM-5-Turbo представляется особенно конкурентоспособным в сценариях OpenClaw, таких как поиск и сбор информации, офисные и повседневные задачи, анализ данных, разработка и эксплуатация, а также автоматизация. Это материалы, предоставленные компанией, а не независимая проверка, но они ясно показывают предполагаемое позиционирование продукта.
Предыстория: z.ai и GLM-5 подготовили почву для Turbo.
Компания Z.ai (ранее известная как Zhipu AI), основанная в 2019 году как дочернее предприятие Университета Цинхуа в Пекине, в настоящее время является одной из самых известных китайских компаний, работающих по модели фундаментального анализа. Штаб-квартира компании по-прежнему находится в Пекине, а руководит ею генеральный директор Чжан Пэн.
Компания Z.ai вышла на Гонконгскую фондовую биржу 8 января 2026 года, торги акциями начались по цене 116,20 гонконгских долларов, а открытие торгов — по цене 120 гонконгских долларов, при заявленной рыночной капитализации в 52,83 миллиарда гонконгских долларов, что сделало ее крупнейшим независимым разработчиком больших языковых моделей в Китае.
По состоянию на 30 сентября 2025 года, по имеющимся данным, ее модели использовались более чем 12 000 корпоративных клиентов, более чем 80 миллионами пользовательских устройств и более чем 45 миллионами разработчиков по всему миру.
Последний крупный релиз Z.ai, GLM-5, дебютировавший в феврале 2026 года, дает полезное представление о том, что компания сейчас пытается сделать с GLM-5-Turbo.
GLM-5 — это флагманская модель с открытым исходным кодом, распространяемая по лицензии MIT, показавшая рекордно низкий показатель галлюцинаций по индексу всезнания AA и представившая собственный «режим агента», способный преобразовывать подсказки или исходные материалы в готовые к использованию файлы .docx, .pdf и .xlsx.
Предыдущий релиз также был представлен как значительный технический шаг вперед для компании. GLM-5 масштабировался до 744 миллиардов параметров с 40 миллиардами активных токенов на токен в архитектуре, сочетающей экспертов, использовал 28,5 триллионов токенов для предварительного обучения и опирался на новую асинхронную инфраструктуру обучения с подкреплением под названием «slime» для уменьшения узких мест в процессе обучения и поддержки более сложного поведения агентов.
В этом свете GLM-5-Turbo выглядит не столько заменой GLM-5, сколько более узкоспециализированным коммерческим ответвлением: вариантом, который сохраняет ориентированность на долгосрочный контекст и работу с агентами, присущую флагманской линейке, но делает акцент на скорости, стабильности и эффективности в реальных цепочках взаимодействия агентов.
Особенности для разработчиков и упаковка моделей
С технической стороны, компания Z.ai оснастила семейство GLM-5 возможностями, которые разработчики сегодня ожидают от серьезных моделей, ориентированных на работу с агентами, включая обработку длительного контекста, инструменты, поддержку логического вывода и структурированную интеграцию.
На странице OpenRouter, посвященной GLM-5-Turbo, указана поддержка инструментов, выбор инструментов и форматирование ответов, а также отображаются данные о производительности в реальном времени, включая среднюю пропускную способность и задержку.
Телеметрия провайдера OpenRouter добавляет полезное сравнение на уровне развертывания между GLM-5 и GLM-5-Turbo, хотя данные не совсем корректны, поскольку GLM-5 используется несколькими провайдерами, а GLM-5-Turbo отображается только через Z.ai.
По пропускной способности GLM-5-Turbo в среднем выдает 48 токенов в секунду на OpenRouter, что ниже показателей самых быстрых конечных точек GLM-5, показанных на скриншотах, включая Fireworks с 70 токенами в секунду и Friendli с 58 токенами в секунду, но выше показателя Together в 40 токенов в секунду.
По показателю задержки первого токена GLM-5-Turbo работает медленнее, чем предыдущая версия, показав время 2,92 секунды против 0,41 секунды у конечной точки GLM-5 от Friendli, 1,00 секунды у Parasail и 1,08 секунды у DeepInfra.
Однако ситуация улучшается по показателю времени выполнения от начала до конца: GLM-5-Turbo показывает время 8,16 секунды, что быстрее, чем конечные точки GLM-5, время выполнения которых варьируется от 9,34 секунды на Fireworks до 11,23 секунды на DeepInfra.
Наиболее существенное преимущество в эксплуатации заключается в надежности инструмента. GLM-5-Turbo демонстрирует частоту ошибок при вызове инструмента в 0,67%, что значительно ниже, чем у представленных поставщиков GLM-5, где частота ошибок колеблется от 2,33% до 6,41%.
Для корпоративных команд это предполагает модель, которая, возможно, не выигрывает по скорости первоначальной реакции в текущей маршрутизации OpenRouter, но все же может лучше подходить для более длительных запусков агентов, где стабильность завершения и меньшая вероятность сбоя инструмента важнее, чем самый быстрый первый токен.
Сравнительный анализ и ценообразование

Диаграмма ZClawBench, опубликованная компанией z.ai, показывает, что GLM-5-Turbo особенно конкурентоспособен в сценариях OpenClaw, таких как поиск и сбор информации, офисные и повседневные задачи, анализ данных, разработка и эксплуатация, а также автоматизация.
Это предоставленные компанией визуализации результатов тестирования, а не независимая проверка, но они помогают объяснить, как Z.ai хочет, чтобы две модели понимали друг друга: GLM-5 как более широкую модель кодирования и открытый флагманский вариант, и Turbo как более целенаправленный вариант выполнения агентов.
Более тонкий сигнал лицензирования
Одним из важных нюансов является лицензирование. Компания Z.ai заявляет, что GLM-5-Turbo в настоящее время является закрытой моделью, но также утверждает, что возможности и результаты модели будут включены в следующий релиз модели с открытым исходным кодом. Это важное различие. Компания не обещает открыто публиковать исходный код GLM-5-Turbo самостоятельно.
Вместо этого, речь идет о том, что уроки, методы и улучшения, полученные в ходе этого релиза, лягут в основу будущей открытой модели. Это делает запуск более тонким, чем просто полный отказ от принципов открытости.
В своей предыдущей стратегии GLM компания Z.ai в значительной степени опиралась на открытые релизы и открытое распределение весов, что помогло ей повысить узнаваемость среди разработчиков.
Китайский рынок искусственного интеллекта, возможно, переориентируется на решения с открытым исходным кодом.
Лицензионная политика GLM-5-Turbo также учитывает более широкий контекст китайского рынка, что делает запуск более значимым, чем простое обновление продукта.
В последние недели сообщения о подразделении Qwen компании Alibaba подняли новые вопросы о том, как ведущие китайские лаборатории искусственного интеллекта будут балансировать между открытым доступом к своим разработкам и коммерческим давлением.
В начале этого месяца глава подразделения Qwen Линь Цзюньян ушел в отставку, став третьим высокопоставленным руководителем Qwen, покинувшим компанию в 2026 году, несмотря на то, что семейство Qwen от Alibaba остается одним из самых продуктивных проектов с открытыми моделями в мире: с 2023 года выпущено более 400 моделей с открытым исходным кодом, а их количество загрузок превысило 1 миллиард.
Затем 16 марта агентство Reuters сообщило, что генеральный директор Alibaba Эдди Ву возьмет на себя прямое управление недавно созданной бизнес-группой, ориентированной на искусственный интеллект, которая объединит Qwen и другие подразделения, на фоне пристального внимания к стратегии, прибыльности и жесткой ценовой конкуренции вокруг предложений с открытой моделью в Китае.
Даже не преувеличивая эти события, они помогают сформулировать более широкий вопрос, висящий над этим сектором: начинают ли экономические факторы, определяющие развитие передового ИИ, подталкивать даже исторически ориентированные на открытость китайские лаборатории к более сегментированной стратегии.
Это не означает, что китайские лаборатории отказываются от открытого исходного кода. Но эту тенденцию становится все труднее игнорировать: открытые модели способствуют внедрению, укреплению доверия разработчиков и расширению экосистемы, в то время как некоторые высокоэффективные варианты, ориентированные на корпоративных агентов, рабочие процессы кодирования и другие коммерчески привлекательные варианты использования, все чаще могут сначала появляться в виде проприетарных продуктов.
В этом смысле GLM-5-Turbo вписывается в более масштабный возможный сдвиг на китайском рынке ИИ, который все больше напоминает стратегию, используемую OpenAI, Anthropic и Google в США: открытость как способ распространения, проприетарные системы как бизнес.
В этом свете GLM-5-Turbo выглядит не просто обновлением продукта, ориентированным на скорость. Это может быть еще одним признаком того, что часть китайского сектора ИИ движется к той же гибридной модели, которая уже распространена в США: открытость как способ распространения, проприетарные системы как бизнес.
Это не будет означать конец открытого ИИ от китайских лабораторий, но может означать, что их наиболее стратегически важные решения, ориентированные на агентов, сначала появятся в закрытом доступе, даже если некоторые из их основных достижений впоследствии войдут в открытые релизы.
Для разработчиков, оценивающих агентские платформы, GLM-5-Turbo — это одновременно и запуск продукта, и полезный сигнал. Z.ai по-прежнему говорит на языке открытых моделей. Но этим релизом компания также показывает, что некоторые из ее наиболее коммерчески значимых разработок могут сначала появиться в виде проприетарной инфраструктуры для агентских систем корпоративного уровня.
Подпишитесь, чтобы получать самые свежие новости!
Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.
Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.
Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.
Источник: venturebeat.com




















