Image

Компания z.ai представила более быструю и дешевую модель GLM-5 Turbo для агентов и «когтей», но она не является открытым исходным кодом.

Карл Франзен

Конькобежец в форме с буквой Z катается на крытом ледовом катке.

Источник: VentureBeat, создано с помощью Google Gemini 3.1 Pro.

Китайский стартап в области искусственного интеллекта Z.ai, известный своим мощным семейством больших языковых моделей (LLM) с открытым исходным кодом, представил GLM-5-Turbo, новый, запатентованный вариант своей модели GLM-5 с открытым исходным кодом, предназначенный для рабочих процессов, управляемых агентами. Компания позиционирует его как более быструю модель, оптимизированную для задач в стиле OpenClaw, таких как использование инструментов, выполнение длинных цепочек и постоянная автоматизация.

Теперь он доступен через программный интерфейс (API) Z.ai на стороннем провайдере OpenRouter с контекстным окном примерно в 202,8 тыс. токенов, максимальным выходным объемом 131,1 тыс. токенов и заявленной ценой в 0,96 доллара за миллион входных токенов и 3,20 доллара за миллион выходных токенов. По нашим расчетам, это примерно на 0,04 доллара дешевле в пересчете на общие входные и выходные затраты (при объеме в 1 миллион токенов), чем у его предшественника.

Модель

Вход

Выход

Общая стоимость

Источник

Grok 4.1 Fast

0,20 доллара

0,50 доллара

0,70 доллара

xAI

Gemini 3 Flash

0,50 доллара

3,00 доллара

3,50 доллара

Google

Кими-К2.5

0,60 доллара

3,00 доллара

3,60 доллара

Лунный выстрел

GLM-5-Turbo

0,96 доллара

3,20 доллара

4,16 доллара

OpenRouter

ГЛМ-5

1,00 долл.

3,20 доллара

4,20 доллара

З.ай

Клод Хайку 4.5

1,00 долл.

5,00 долларов

6,00 долларов

Антропический

Qwen3-Max

1,20 доллара

6,00 долларов

7,20 долларов

Alibaba Cloud

Gemini 3 Pro

2,00 доллара

12,00 долларов

14,00 долларов

Google

ГПТ-5.2

1,75 доллара

14,00 долларов

15,75 долларов

OpenAI

ГПТ-5.4

2,50 доллара

15,00 долларов

17,50 долларов

OpenAI

Клод Сонет 4.5

3,00 доллара

15,00 долларов

18,00 долларов

Антропический

Клод Опус 4.6

5,00 долларов

25,00 долларов

30,00 долларов

Антропический

GPT-5.4 Pro

30,00 долларов

180,00 долларов США

210,00 долларов США

OpenAI

Во-вторых, Z.ai также добавляет эту модель в свой подписной продукт GLM Coding, который представляет собой готовый сервис помощи в программировании. Этот сервис имеет три уровня: Lite за 27 долларов в квартал, Pro за 81 доллар в квартал и Max за 216 долларов в квартал.

В сообщении Z.ai от 15 марта о начале продаж говорится, что подписчики Pro получат GLM-5-Turbo в марте, а подписчики Lite — базовую версию GLM-5 в марте, а GLM-5-Turbo им придётся ждать до апреля. Компания также принимает заявки на ранний доступ для корпоративных клиентов через форму Google, что предполагает, что некоторые пользователи могут получить доступ раньше указанного срока в зависимости от наличия ресурсов.

Компания z.ai описывает GLM-5-Turbo как алгоритм, разработанный для «быстрого вывода» и «глубоко оптимизированный для реальных рабочих процессов агентов, включающих длинные цепочки выполнения», с улучшениями в декомпозиции сложных инструкций, использовании инструментов, запланированном и постоянном выполнении, а также стабильности при выполнении длительных задач.

Этот релиз предлагает разработчикам новый вариант для создания автономных агентов искусственного интеллекта в стиле OpenClaw и служит сигналом о том, куда, по мнению поставщиков моделей, движется корпоративный спрос: от чат-интерфейсов к системам, способным надежно выполнять многоэтапную работу.

Сейчас значительная часть конкуренции смещается именно в этом направлении, особенно среди поставщиков, стремящихся привлечь разработчиков и корпоративные команды, создающие внутренних ассистентов, оркестраторов рабочих процессов и агентов для программирования.

Создано для реализации, а не просто для обсуждения.

В материалах Z.ai модель GLM-5-Turbo представлена как модель поведения агентов, имитирующая производственный процесс, а не как статическое использование в режиме «запрос-ответ».

Основной упор делается на надежность в практических задачах: улучшенное выполнение команд, более надежный вызов инструментов, улучшенная обработка запланированных и постоянных задач, а также более быстрое выполнение в более длинных логических цепочках. Такое позиционирование выводит модель на рынок агентов, которые делают больше, чем просто отвечают на вопросы.

Она предназначена для систем, способных собирать информацию, вызывать инструменты, разбивать инструкции и продолжать работу над сложными последовательностями задач с минимальным контролем.

Вместо того чтобы быть прямым преемником GLM-5, GLM-5-Turbo, по-видимому, представляет собой более ориентированный на производительность вариант: оптимизированный для скорости, использования инструментов и стабильности длинных цепочек агентов, в то время как базовая версия GLM-5 остается флагманской открытой разработкой Z.ai.

GLM-5-Turbo представляется особенно конкурентоспособным в сценариях OpenClaw, таких как поиск и сбор информации, офисные и повседневные задачи, анализ данных, разработка и эксплуатация, а также автоматизация. Это материалы, предоставленные компанией, а не независимая проверка, но они ясно показывают предполагаемое позиционирование продукта.

Предыстория: z.ai и GLM-5 подготовили почву для Turbo.

Компания Z.ai (ранее известная как Zhipu AI), основанная в 2019 году как дочернее предприятие Университета Цинхуа в Пекине, в настоящее время является одной из самых известных китайских компаний, работающих по модели фундаментального анализа. Штаб-квартира компании по-прежнему находится в Пекине, а руководит ею генеральный директор Чжан Пэн.

Компания Z.ai вышла на Гонконгскую фондовую биржу 8 января 2026 года, торги акциями начались по цене 116,20 гонконгских долларов, а открытие торгов — по цене 120 гонконгских долларов, при заявленной рыночной капитализации в 52,83 миллиарда гонконгских долларов, что сделало ее крупнейшим независимым разработчиком больших языковых моделей в Китае.

По состоянию на 30 сентября 2025 года, по имеющимся данным, ее модели использовались более чем 12 000 корпоративных клиентов, более чем 80 миллионами пользовательских устройств и более чем 45 миллионами разработчиков по всему миру.

Последний крупный релиз Z.ai, GLM-5, дебютировавший в феврале 2026 года, дает полезное представление о том, что компания сейчас пытается сделать с GLM-5-Turbo.

GLM-5 — это флагманская модель с открытым исходным кодом, распространяемая по лицензии MIT, показавшая рекордно низкий показатель галлюцинаций по индексу всезнания AA и представившая собственный «режим агента», способный преобразовывать подсказки или исходные материалы в готовые к использованию файлы .docx, .pdf и .xlsx.

Предыдущий релиз также был представлен как значительный технический шаг вперед для компании. GLM-5 масштабировался до 744 миллиардов параметров с 40 миллиардами активных токенов на токен в архитектуре, сочетающей экспертов, использовал 28,5 триллионов токенов для предварительного обучения и опирался на новую асинхронную инфраструктуру обучения с подкреплением под названием «slime» для уменьшения узких мест в процессе обучения и поддержки более сложного поведения агентов.

В этом свете GLM-5-Turbo выглядит не столько заменой GLM-5, сколько более узкоспециализированным коммерческим ответвлением: вариантом, который сохраняет ориентированность на долгосрочный контекст и работу с агентами, присущую флагманской линейке, но делает акцент на скорости, стабильности и эффективности в реальных цепочках взаимодействия агентов.

Особенности для разработчиков и упаковка моделей

С технической стороны, компания Z.ai оснастила семейство GLM-5 возможностями, которые разработчики сегодня ожидают от серьезных моделей, ориентированных на работу с агентами, включая обработку длительного контекста, инструменты, поддержку логического вывода и структурированную интеграцию.

На странице OpenRouter, посвященной GLM-5-Turbo, указана поддержка инструментов, выбор инструментов и форматирование ответов, а также отображаются данные о производительности в реальном времени, включая среднюю пропускную способность и задержку.

Телеметрия провайдера OpenRouter добавляет полезное сравнение на уровне развертывания между GLM-5 и GLM-5-Turbo, хотя данные не совсем корректны, поскольку GLM-5 используется несколькими провайдерами, а GLM-5-Turbo отображается только через Z.ai.

По пропускной способности GLM-5-Turbo в среднем выдает 48 токенов в секунду на OpenRouter, что ниже показателей самых быстрых конечных точек GLM-5, показанных на скриншотах, включая Fireworks с 70 токенами в секунду и Friendli с 58 токенами в секунду, но выше показателя Together в 40 токенов в секунду.

По показателю задержки первого токена GLM-5-Turbo работает медленнее, чем предыдущая версия, показав время 2,92 секунды против 0,41 секунды у конечной точки GLM-5 от Friendli, 1,00 секунды у Parasail и 1,08 секунды у DeepInfra.

Однако ситуация улучшается по показателю времени выполнения от начала до конца: GLM-5-Turbo показывает время 8,16 секунды, что быстрее, чем конечные точки GLM-5, время выполнения которых варьируется от 9,34 секунды на Fireworks до 11,23 секунды на DeepInfra.

Наиболее существенное преимущество в эксплуатации заключается в надежности инструмента. GLM-5-Turbo демонстрирует частоту ошибок при вызове инструмента в 0,67%, что значительно ниже, чем у представленных поставщиков GLM-5, где частота ошибок колеблется от 2,33% до 6,41%.

Для корпоративных команд это предполагает модель, которая, возможно, не выигрывает по скорости первоначальной реакции в текущей маршрутизации OpenRouter, но все же может лучше подходить для более длительных запусков агентов, где стабильность завершения и меньшая вероятность сбоя инструмента важнее, чем самый быстрый первый токен.

Сравнительный анализ и ценообразование

Диаграмма результатов тестирования z.ai GLM-5 Turbo

Диаграмма результатов тестирования z.ai GLM-5 Turbo. Источник: z.ai

Диаграмма ZClawBench, опубликованная компанией z.ai, показывает, что GLM-5-Turbo особенно конкурентоспособен в сценариях OpenClaw, таких как поиск и сбор информации, офисные и повседневные задачи, анализ данных, разработка и эксплуатация, а также автоматизация.

Это предоставленные компанией визуализации результатов тестирования, а не независимая проверка, но они помогают объяснить, как Z.ai хочет, чтобы две модели понимали друг друга: GLM-5 как более широкую модель кодирования и открытый флагманский вариант, и Turbo как более целенаправленный вариант выполнения агентов.

Более тонкий сигнал лицензирования

Одним из важных нюансов является лицензирование. Компания Z.ai заявляет, что GLM-5-Turbo в настоящее время является закрытой моделью, но также утверждает, что возможности и результаты модели будут включены в следующий релиз модели с открытым исходным кодом. Это важное различие. Компания не обещает открыто публиковать исходный код GLM-5-Turbo самостоятельно.

Вместо этого, речь идет о том, что уроки, методы и улучшения, полученные в ходе этого релиза, лягут в основу будущей открытой модели. Это делает запуск более тонким, чем просто полный отказ от принципов открытости.

В своей предыдущей стратегии GLM компания Z.ai в значительной степени опиралась на открытые релизы и открытое распределение весов, что помогло ей повысить узнаваемость среди разработчиков.

Китайский рынок искусственного интеллекта, возможно, переориентируется на решения с открытым исходным кодом.

Лицензионная политика GLM-5-Turbo также учитывает более широкий контекст китайского рынка, что делает запуск более значимым, чем простое обновление продукта.

В последние недели сообщения о подразделении Qwen компании Alibaba подняли новые вопросы о том, как ведущие китайские лаборатории искусственного интеллекта будут балансировать между открытым доступом к своим разработкам и коммерческим давлением.

В начале этого месяца глава подразделения Qwen Линь Цзюньян ушел в отставку, став третьим высокопоставленным руководителем Qwen, покинувшим компанию в 2026 году, несмотря на то, что семейство Qwen от Alibaba остается одним из самых продуктивных проектов с открытыми моделями в мире: с 2023 года выпущено более 400 моделей с открытым исходным кодом, а их количество загрузок превысило 1 миллиард.

Затем 16 марта агентство Reuters сообщило, что генеральный директор Alibaba Эдди Ву возьмет на себя прямое управление недавно созданной бизнес-группой, ориентированной на искусственный интеллект, которая объединит Qwen и другие подразделения, на фоне пристального внимания к стратегии, прибыльности и жесткой ценовой конкуренции вокруг предложений с открытой моделью в Китае.

Даже не преувеличивая эти события, они помогают сформулировать более широкий вопрос, висящий над этим сектором: начинают ли экономические факторы, определяющие развитие передового ИИ, подталкивать даже исторически ориентированные на открытость китайские лаборатории к более сегментированной стратегии.

Это не означает, что китайские лаборатории отказываются от открытого исходного кода. Но эту тенденцию становится все труднее игнорировать: открытые модели способствуют внедрению, укреплению доверия разработчиков и расширению экосистемы, в то время как некоторые высокоэффективные варианты, ориентированные на корпоративных агентов, рабочие процессы кодирования и другие коммерчески привлекательные варианты использования, все чаще могут сначала появляться в виде проприетарных продуктов.

В этом смысле GLM-5-Turbo вписывается в более масштабный возможный сдвиг на китайском рынке ИИ, который все больше напоминает стратегию, используемую OpenAI, Anthropic и Google в США: открытость как способ распространения, проприетарные системы как бизнес.

В этом свете GLM-5-Turbo выглядит не просто обновлением продукта, ориентированным на скорость. Это может быть еще одним признаком того, что часть китайского сектора ИИ движется к той же гибридной модели, которая уже распространена в США: открытость как способ распространения, проприетарные системы как бизнес.

Это не будет означать конец открытого ИИ от китайских лабораторий, но может означать, что их наиболее стратегически важные решения, ориентированные на агентов, сначала появятся в закрытом доступе, даже если некоторые из их основных достижений впоследствии войдут в открытые релизы.

Для разработчиков, оценивающих агентские платформы, GLM-5-Turbo — это одновременно и запуск продукта, и полезный сигнал. Z.ai по-прежнему говорит на языке открытых моделей. Но этим релизом компания также показывает, что некоторые из ее наиболее коммерчески значимых разработок могут сначала появиться в виде проприетарной инфраструктуры для агентских систем корпоративного уровня.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: GLM-5 Turbo, Z.ai, Агенты, Когти, Компания, Модель, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Мелкие размеры помогли жукам спастись из пасти сома. При этом вертячки и плавунцы выживали чаще водолюбов
«Восстание солдат искусственного интеллекта». Два робота Phantom MK-1 переданы в ВСУ для тестов на поле боя
Квантовики разработали новую математическую модель криптографии.
Китай одобрил продажу первых микрочипов для обработки мозга и планирует занять лидирующие позиции в отрасли.
Система жидкостного охлаждения для ПК с RGB-подсветкой, три вентилятора.
ChatGPT, Copilot и другие: помогают или делают ленивым?
Supermicro сервер CMX с архитектурой хранения NVIDIA STX.
ideipro logotyp
Теперь официально: нейросети умеют производить не только тонны текста, но…
Image Not Found
Мелкие размеры помогли жукам спастись из пасти сома. При этом вертячки и плавунцы выживали чаще водолюбов

Мелкие размеры помогли жукам спастись из пасти сома. При этом вертячки и плавунцы выживали чаще водолюбов

При этом вертячки и плавунцы выживали чаще водолюбов Сомы чаще выплевывают пойманных водяных жуков, если те мелкие. По мнению японского зоолога Синдзи Сугиура, они активнее передвигаются в ротовой полости сома или цепляются за ее поверхность, мешая проглотить себя, и в результате рыбы их выплевывают. А вот…

Мар 20, 2026
«Восстание солдат искусственного интеллекта». Два робота Phantom MK-1 переданы в ВСУ для тестов на поле боя

«Восстание солдат искусственного интеллекта». Два робота Phantom MK-1 переданы в ВСУ для тестов на поле боя

На наших глазах сюжеты антиутопической научной фантастики становятся реальностью. Американская компания Foundation отправила на Украину двух своих гуманоидных роботов Phantom MK-1, и это может стать началом новой вехи в военном деле Когда-то все зевнули тему с дронами…

Мар 20, 2026
Система жидкостного охлаждения для ПК с RGB-подсветкой, три вентилятора.

Sharkoon начала продажи готовой СЖО S100 ARGB за €120

Компания Sharkoon сообщила о расширении модельного ряда своих готовых систем жидкостного охлаждения, добавив в него модель S100 ARGB. Она поставляется с 360-мм радиатором чёрного или белого цвета, который продувается при помощи трёх вентиляторов, совершающих от 500 до…

Мар 20, 2026
Supermicro сервер CMX с архитектурой хранения NVIDIA STX.

Supermicro представила сервер хранения данных NVIDIA BlueField-4 STX для повышения производительности инференса искусственного интеллекта

Supermicro, Inc., поставщик комплексных IT-решений для ИИ, облака, хранения и сетей 5G/Edge, сегодня представила один из первых в отрасли серверов хранения контекстной памяти (CMX) в рамках эталонной архитектуры NVIDIA STX, анонсированной на NVIDIA GTC 2026. STX —…

Мар 20, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых