GLM-5.2 от Z.ai, использующая открытые веса, превосходит GPT-5.5 в нескольких долгосрочных тестах программирования при стоимости в 6 раз меньшей.
Карл Франзен
Сегодня китайский стартап в области искусственного интеллекта Z.ai (ранее Zhipu AI) объявил о немедленном выпуске GLM-5.2, большой языковой модели (LLM) с открытыми весами и 753 миллиардами параметров, разработанной специально для решения задач автономного программирования и инженерии в долгосрочной перспективе.
Модель, доступная сразу же на платформе Hugging Face, через API Z.ai и более чем в 20 сторонних средах разработки, отличается высокой стабильностью контекстного окна в 1 миллион токенов, а также корпоративными подписками, начинающимися всего с 12,60 долларов в месяц.
Отличная новость для компаний, заботящихся о стоимости и безопасности: z.ai выпустила основные веса GLM-5.2 под неограниченной открытой лицензией MIT, что позволяет предприятиям бесплатно загружать модель с Hugging Face, настраивать или дорабатывать ее по своему усмотрению и запускать ее, возможно, локально или на виртуальных машинах, оплачивая только вычислительные ресурсы и электроэнергию.
Это становится все более привлекательным вариантом для предприятий, поскольку передовые американские проприетарные модели сталкиваются с неопределенным и потенциально прерванным будущим регулирования после директивы администрации Трампа по экспортному контролю, изданной на прошлой неделе и запрещающей иностранным гражданам использовать новую модель Claude Fable 5 от Anthropic (в ответ на что компания полностью отключила соответствующие модели для всех пользователей).
Для руководителей предприятий, принимающих технические решения, GLM-5.2 от z.ai предоставляет высокоэффективный способ локального размещения передового искусственного интеллекта, полностью обходя географические ограничения и коммерческие рамки.
IndexShare повторно использует один индексатор на каждые четыре слоя разреженного внимания, что снижает потребность в вычислительных ресурсах.
В основе GLM-5.2 лежат 753 миллиарда параметров, и в ней реализована важная архитектурная оптимизация под названием «IndexShare».
В стандартных моделях обработки больших объемов данных пересчет механизмов внимания для длинных документов является чрезмерно ресурсоемким процессом с точки зрения вычислительных затрат. IndexShare решает эту проблему, используя один и тот же индексатор для каждых четырех слоев разреженного внимания.
При максимальной длине контекста в 1 миллион токенов это единственное нововведение снижает вычислительную нагрузку на один токен в 2,9 раза.
Модель также включает в себя модернизированный слой прогнозирования нескольких токенов (MTP) для спекулятивного декодирования, который увеличивает допустимую длину токена до 20% во время вывода.
Кроме того, Z.ai реализовала гибкие, выбираемые «режимы мышления». Пользователи могут переключать уровень логического мышления модели между «максимальным», предназначенным для проверки пределов решения логических задач, и «высоким», который обеспечивает тщательный баланс между высокой производительностью и эффективностью использования токенов, чувствительных к задержкам.
Передовые показатели для открытой модели, сопоставимые, а в некоторых категориях даже превосходящие показатели лидеров среди проприетарных решений.
В стандартных отраслевых бенчмарк-тестах сторонних разработчиков GLM-5.2 превосходит большинство флагманских моделей с открытым исходным кодом, даже DeepSeek v4, и показывает результаты, близкие или превосходящие показатели конкурентов с закрытыми весами, таких как GPT-5.5 от OpenAI и Claude Opus 4.8 от Anthropic.

Данная модель особенно хорошо зарекомендовала себя при использовании агентных инструментов и в задачах разработки программного обеспечения с долгосрочным горизонтом планирования:
-
SWE-bench Pro: GLM-5.2 набрал 62,1 балла, значительно превзойдя GPT-5.5 (58,6) и своего предшественника, GLM-5.1 (58,4).
-
FrontierSWE (Dominance): Тест GLM-5.2, разработанный для проверки выполнения задач в долгосрочной перспективе, показал результат 74,4%, превзойдя GPT-5.5 (72,6%) и почти сравнявшись с Claude Opus 4.8 (75,1%).

-
MCP-Atlas: В этой оценке использования инструмента GLM-5.2 получил 77,0 баллов, опередив GPT-5.5 (75,3) и немного уступив Claude Opus 4.8 (77,8).
-
Последний экзамен человечества (с использованием инструментов): При использовании внешних инструментов GLM-5.2 набрал 54,7 балла, опередив GPT-5.5 (52,2) и немного отстав от Claude Opus 4.8 (57,9).
-
PostTrainBench и SWE-Marathon: В длительных, многочасовых инженерных нагрузках GLM-5.2 неизменно превосходил GPT-5.5, набрав 34,3% против 25,0% у GPT-5.5 на PostTrainBench и 13,0% против 12,0% у GPT-5.5 на SWE-Marathon.
Хотя GLM-5.2 немного уступает Claude Opus 4.8 и GPT-5.5 по результатам теста Terminal-Bench 2.1 (81,0 против 85,0 и 84,0 соответственно), он значительно превосходит Google Gemini 3.1 Pro (74,0).
Помимо традиционных метрик программирования, GLM-5.2 занял впечатляющее первое место в краудсорсинговом тесте по проектированию Design Arena, обойдя даже упомянутый выше передовой тест Claude Fable 5 с показателем ELO 1360.
Кроме того, влияние новых выбираемых «режимов мышления» Z.ai отчетливо видно в данных: при уровне сложности «Максимальный» GLM-5.2 достигает пикового интеллекта, но использует почти 85 тысяч выходных токенов на задачу. Переключение на уровень сложности «Высокий» снижает производительность всего на несколько пунктов, при этом фактически вдвое уменьшая требуемый объем выходных токенов, что обеспечивает важный рычаг оптимизации для приложений, чувствительных к задержкам.
Доступно через планы кодирования и API.
Для внедрения модели в практику компания Z.ai запустила план кодирования GLM, ориентированный непосредственно на рабочие процессы разработчиков, а не на простые интерфейсы чата.
План предлагает готовую поддержку сторонних американских и глобальных инструментов и средств программирования, включая Claude Code, OpenClaw, Cline, Kilo Code, Crush и Factory, и другие. Цены на тарифные планы Coding Plan (при ежегодной оплате) весьма конкурентоспособны:
-
Lite: 12,60 долларов в месяц (151,20 долларов в год, начиная со второго года), ориентирован на упрощенную итерацию в небольших репозиториях.
-
Плюсы: 50,40 долларов в месяц за ежедневную разработку в репозиториях среднего размера, что в 5 раз превышает лимит использования по сравнению с планом Lite.
-
Максимальная стоимость: 112,00 долларов в месяц для ресурсоемких задач, что обеспечивает в 20 раз больший объем использования по сравнению с облегченной версией и выделенные ресурсы в часы пик.
Для корпоративных разработчиков, интегрирующих исходную модель в свои приложения, ценообразование API от Z.ai значительно дешевле, чем у западных конкурентов, и при этом точно соответствует ценам предыдущего поколения GLM-5.1.
Стоимость доступа к API GLM-5.2 составляет 1,40 доллара США за миллион входных токенов и 4,40 доллара США за миллион выходных токенов , что делает эту модель средней ценовой категории в глобальном масштабе.
Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.
Отсортировано по общей стоимости (вход + выход) от наименьшей к наибольшей. Указаны стандартные цены с оплатой по факту использования за 1 миллион токенов.
|
Модель |
Вход |
Выход |
Общая стоимость |
Источник |
|
MiMo-V2.5 Flash |
0,10 доллара |
0,30 доллара |
0,40 доллара |
Сяоми МиМо |
|
deepseek-v4-flash |
0,14 доллара |
0,28 доллара |
0,42 доллара |
DeepSeek |
|
deepseek-v4-pro |
0,435 доллара |
0,87 доллара |
1,305 доллара |
DeepSeek |
|
МиниМакс-М3 |
0,30 доллара |
1,20 доллара |
1,50 доллара |
МиниМакс |
|
Фонарик Gemini 3.1 |
0,25 доллара |
1,50 доллара |
1,75 доллара |
|
|
Qwen3.7-Plus |
0,40 доллара |
1,60 доллара |
2,00 доллара |
Alibaba Cloud |
|
MiMo-V2.5 |
0,40 доллара |
2,00 доллара |
2,40 доллара |
Сяоми МиМо |
|
Grok 4.3 (низкий контекст) |
1,25 доллара |
2,50 доллара |
3,75 доллара |
xAI |
|
MiMo-V2.5 Pro (≤256K) |
1,00 долл. |
3,00 доллара |
4,00 доллара |
Сяоми МиМо |
|
Кими-К2.6 |
0,95 доллара |
4,00 доллара |
4,95 доллара |
Муншот/Кими |
|
GLM-5.2 |
1,40 доллара |
4,40 доллара |
5,80 долларов |
З.ай |
|
Grok 4.3 (высококонтекстный) |
2,50 доллара |
5,00 долларов |
7,50 долларов |
xAI |
|
MiMo-V2.5 Pro (>256K) |
2,00 доллара |
6,00 долларов |
8,00 долларов |
Сяоми МиМо |
|
Qwen3.7-Max |
2,50 доллара |
7,50 долларов |
10,00 долларов |
Alibaba Cloud |
|
Вспышка Gemini 3.5 |
1,50 доллара |
9,00 долларов |
10,50 долларов |
|
|
Gemini 3.1 Pro Preview (≤200K) |
2,00 доллара |
12,00 долларов |
14,00 долларов |
|
|
ГПТ-5.4 |
2,50 доллара |
15,00 долларов |
17,50 долларов |
OpenAI |
|
Gemini 3.1 Pro Preview (>200K) |
4,00 доллара |
18,00 долларов |
22,00 долларов |
|
|
Клод Опус 4.8 |
5,00 долларов |
25,00 долларов |
30,00 долларов |
Антропический |
|
ГПТ-5.5 |
5,00 долларов |
30,00 долларов |
35,00 долларов |
OpenAI |
|
Клод Басня 5 / Клод Мифос 5 |
10,00 долларов |
50,00 долларов |
60,00 долларов |
Антропический |
Для дальнейшей оптимизации затрат на обработку данных с длительным контекстом Z.ai предлагает кэширование входных данных по цене всего 0,26 доллара США за миллион токенов, а также ограниченное по времени предложение бесплатного хранения кэшированных входных данных.
Резкий контраст между новаторами, использующими открытые весовые коэффициенты, и западными лабораториями, работающими в рамках собственных разработок, не остался незамеченным сообществом разработчиков.
На платформе X известный наблюдатель за ИИ Лисан аль Гаиб (@scaling01) утверждал, что «передовые лаборатории откровенно обманывают вас в вопросе ценообразования API».
В сообщении отмечалось, что в то время как такие масштабные открытые модели, как GLM-5.2 с 744 миллиардами параметров, взимают 4,40 доллара за миллион выходных токенов, а DeepSeek-V4-Pro (1,6 триллиона параметров) — всего 0,87 доллара, проприетарные модели требуют значительно большей наценки: Sonnet 4.6 и Opus 4.8 от Anthropic взимают 15 и 25 долларов соответственно, а GPT-5.5 от OpenAI стоит 30 долларов за выходной сигнал.
Подчеркивая, что разработчики, работающие по открытым моделям, получают прибыль, не полагаясь на новейшие «модные чипы Blackwell», комментатор предположил, что ведущие проприетарные лаборатории «вероятно, имеют маржу более 90% на данный момент».
Преимущества неизмененной лицензии MIT для корпоративного использования.
Наиболее существенным изменением в выпуске GLM-5.2 стало лицензирование. Компания Z.ai выпустила веса модели под открытой лицензией MIT, тем самым утвердив её как «чисто открытую» систему.
В технической документации компании прямо указано, что данная лицензия гарантирует «отсутствие региональных ограничений» и обеспечивает «технический доступ без границ».
Для руководителей технологических подразделений предприятий лицензия MIT означает, что программное обеспечение можно использовать, модифицировать и коммерциализировать без уплаты роялти или соблюдения ограничительных правил «допустимого использования», характерных для лицензий двойного назначения.
Это позволяет инженерным группам размещать передовые системы искусственного интеллекта на собственной суверенной инфраструктуре, полностью исключая зависимость от конкретного поставщика.
Теплый прием среди разработчиков ИИ и создателей инструментов.
Реакция разработчиков на релиз была незамедлительной и в подавляющем большинстве положительной.
Команда разработчиков Kilo Code подтвердила интеграцию с первого дня, опубликовав на X следующее сообщение: «GLM-5.2 запускается в Kilo Code с первого дня. Окно контекста 1M и режим максимального усилия уже доступны. Настройте параметры и приступайте!».
В среде разработки с открытым исходным кодом Cline IDE на платформе X выразили аналогичное мнение, отметив экономическое преимущество: «GLM-5.2 — первая модель с открытыми весами, которая преодолела отметку в 80% на Terminal-Bench и превосходит все остальные доступные модели с открытым исходным кодом. Она также превосходит Gemini, что делает её моделью передового уровня за небольшую часть стоимости. Открытые веса вернулись. Эта модель меняет правила игры. Доступна в Cline уже сейчас!».
Аналогичным образом, конкурирующий настольный агент с открытым исходным кодом Eigent AI также протестировал новые возможности модели на сложных рабочих процессах с участием агентов, отметив на X: «была поставлена действительно долгосрочная задача: исследование 30 компаний в 6 секторах инфраструктуры ИИ, структурирование данных в JSON, а затем создание интерактивного HTML-отчета… где 5.2 опережает: -> планы…».

Подпишитесь, чтобы получать самые свежие новости!
Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.
VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они
Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.
Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.
Источник: venturebeat.com
Похожие записи
Оцените материал:
Похожие записи
Ring от Amazon будет сотрудничать с Flock — сетью камер на базе искусственного интеллекта, используемых иммиграционной и таможенной полицией, федеральными властями и полицией.
17.10.2025Архаические люди пустили на дрова плавник 780 тысяч лет назад. В этом заподозрили обитателей стоянки Гешер-Бенот-Яаков
11.04.2026
Искусственный интеллект совершил прорыв, решив сложнейшую задачу трех тел
13.10.2025Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
