Архив рубрики ~Лента новостей~

GLM-5.2 от Z.ai, использующая открытые веса, превосходит GPT-5.5 в нескольких долгосрочных тестах программирования при стоимости в 6 раз меньшей.

GLM-5.2 от Z.ai, использующая открытые веса, превосходит GPT-5.5 в нескольких долгосрочных тестах программирования при стоимости в 6 раз меньшей.
GLM-5.2 от Z.ai, использующая открытые веса, превосходит GPT-5.5 в нескольких долгосрочных тестах программирования при стоимости в 6 раз меньшей.

Карл Франзен

Сегодня китайский стартап в области искусственного интеллекта Z.ai (ранее Zhipu AI) объявил о немедленном выпуске GLM-5.2, большой языковой модели (LLM) с открытыми весами и 753 миллиардами параметров, разработанной специально для решения задач автономного программирования и инженерии в долгосрочной перспективе.

Модель, доступная сразу же на платформе Hugging Face, через API Z.ai и более чем в 20 сторонних средах разработки, отличается высокой стабильностью контекстного окна в 1 миллион токенов, а также корпоративными подписками, начинающимися всего с 12,60 долларов в месяц.

Отличная новость для компаний, заботящихся о стоимости и безопасности: z.ai выпустила основные веса GLM-5.2 под неограниченной открытой лицензией MIT, что позволяет предприятиям бесплатно загружать модель с Hugging Face, настраивать или дорабатывать ее по своему усмотрению и запускать ее, возможно, локально или на виртуальных машинах, оплачивая только вычислительные ресурсы и электроэнергию.

Это становится все более привлекательным вариантом для предприятий, поскольку передовые американские проприетарные модели сталкиваются с неопределенным и потенциально прерванным будущим регулирования после директивы администрации Трампа по экспортному контролю, изданной на прошлой неделе и запрещающей иностранным гражданам использовать новую модель Claude Fable 5 от Anthropic (в ответ на что компания полностью отключила соответствующие модели для всех пользователей).

Для руководителей предприятий, принимающих технические решения, GLM-5.2 от z.ai предоставляет высокоэффективный способ локального размещения передового искусственного интеллекта, полностью обходя географические ограничения и коммерческие рамки.

IndexShare повторно использует один индексатор на каждые четыре слоя разреженного внимания, что снижает потребность в вычислительных ресурсах.

В основе GLM-5.2 лежат 753 миллиарда параметров, и в ней реализована важная архитектурная оптимизация под названием «IndexShare».

В стандартных моделях обработки больших объемов данных пересчет механизмов внимания для длинных документов является чрезмерно ресурсоемким процессом с точки зрения вычислительных затрат. IndexShare решает эту проблему, используя один и тот же индексатор для каждых четырех слоев разреженного внимания.

При максимальной длине контекста в 1 миллион токенов это единственное нововведение снижает вычислительную нагрузку на один токен в 2,9 раза.

Модель также включает в себя модернизированный слой прогнозирования нескольких токенов (MTP) для спекулятивного декодирования, который увеличивает допустимую длину токена до 20% во время вывода.

Кроме того, Z.ai реализовала гибкие, выбираемые «режимы мышления». Пользователи могут переключать уровень логического мышления модели между «максимальным», предназначенным для проверки пределов решения логических задач, и «высоким», который обеспечивает тщательный баланс между высокой производительностью и эффективностью использования токенов, чувствительных к задержкам.

Передовые показатели для открытой модели, сопоставимые, а в некоторых категориях даже превосходящие показатели лидеров среди проприетарных решений.

В стандартных отраслевых бенчмарк-тестах сторонних разработчиков GLM-5.2 превосходит большинство флагманских моделей с открытым исходным кодом, даже DeepSeek v4, и показывает результаты, близкие или превосходящие показатели конкурентов с закрытыми весами, таких как GPT-5.5 от OpenAI и Claude Opus 4.8 от Anthropic.

Тесты GLM-5.2

Данная модель особенно хорошо зарекомендовала себя при использовании агентных инструментов и в задачах разработки программного обеспечения с долгосрочным горизонтом планирования:

  • SWE-bench Pro: GLM-5.2 набрал 62,1 балла, значительно превзойдя GPT-5.5 (58,6) и своего предшественника, GLM-5.1 (58,4).

  • FrontierSWE (Dominance): Тест GLM-5.2, разработанный для проверки выполнения задач в долгосрочной перспективе, показал результат 74,4%, превзойдя GPT-5.5 (72,6%) и почти сравнявшись с Claude Opus 4.8 (75,1%).

Тесты производительности GLM-5.2 для задач с долгосрочным горизонтом
  • MCP-Atlas: В этой оценке использования инструмента GLM-5.2 получил 77,0 баллов, опередив GPT-5.5 (75,3) и немного уступив Claude Opus 4.8 (77,8).

  • Последний экзамен человечества (с использованием инструментов): При использовании внешних инструментов GLM-5.2 набрал 54,7 балла, опередив GPT-5.5 (52,2) и немного отстав от Claude Opus 4.8 (57,9).

  • PostTrainBench и SWE-Marathon: В длительных, многочасовых инженерных нагрузках GLM-5.2 неизменно превосходил GPT-5.5, набрав 34,3% против 25,0% у GPT-5.5 на PostTrainBench и 13,0% против 12,0% у GPT-5.5 на SWE-Marathon.

Хотя GLM-5.2 немного уступает Claude Opus 4.8 и GPT-5.5 по результатам теста Terminal-Bench 2.1 (81,0 против 85,0 и 84,0 соответственно), он значительно превосходит Google Gemini 3.1 Pro (74,0).

Помимо традиционных метрик программирования, GLM-5.2 занял впечатляющее первое место в краудсорсинговом тесте по проектированию Design Arena, обойдя даже упомянутый выше передовой тест Claude Fable 5 с показателем ELO 1360.

Кроме того, влияние новых выбираемых «режимов мышления» Z.ai отчетливо видно в данных: при уровне сложности «Максимальный» GLM-5.2 достигает пикового интеллекта, но использует почти 85 тысяч выходных токенов на задачу. Переключение на уровень сложности «Высокий» снижает производительность всего на несколько пунктов, при этом фактически вдвое уменьшая требуемый объем выходных токенов, что обеспечивает важный рычаг оптимизации для приложений, чувствительных к задержкам.

Доступно через планы кодирования и API.

Для внедрения модели в практику компания Z.ai запустила план кодирования GLM, ориентированный непосредственно на рабочие процессы разработчиков, а не на простые интерфейсы чата.

План предлагает готовую поддержку сторонних американских и глобальных инструментов и средств программирования, включая Claude Code, OpenClaw, Cline, Kilo Code, Crush и Factory, и другие. Цены на тарифные планы Coding Plan (при ежегодной оплате) весьма конкурентоспособны:

  • Lite: 12,60 долларов в месяц (151,20 долларов в год, начиная со второго года), ориентирован на упрощенную итерацию в небольших репозиториях.

  • Плюсы: 50,40 долларов в месяц за ежедневную разработку в репозиториях среднего размера, что в 5 раз превышает лимит использования по сравнению с планом Lite.

  • Максимальная стоимость: 112,00 долларов в месяц для ресурсоемких задач, что обеспечивает в 20 раз больший объем использования по сравнению с облегченной версией и выделенные ресурсы в часы пик.

Для корпоративных разработчиков, интегрирующих исходную модель в свои приложения, ценообразование API от Z.ai значительно дешевле, чем у западных конкурентов, и при этом точно соответствует ценам предыдущего поколения GLM-5.1.

Стоимость доступа к API GLM-5.2 составляет 1,40 доллара США за миллион входных токенов и 4,40 доллара США за миллион выходных токенов , что делает эту модель средней ценовой категории в глобальном масштабе.

Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.

Отсортировано по общей стоимости (вход + выход) от наименьшей к наибольшей. Указаны стандартные цены с оплатой по факту использования за 1 миллион токенов.

Модель

Вход

Выход

Общая стоимость

Источник

MiMo-V2.5 Flash

0,10 доллара

0,30 доллара

0,40 доллара

Сяоми МиМо

deepseek-v4-flash

0,14 доллара

0,28 доллара

0,42 доллара

DeepSeek

deepseek-v4-pro

0,435 доллара

0,87 доллара

1,305 доллара

DeepSeek

МиниМакс-М3

0,30 доллара

1,20 доллара

1,50 доллара

МиниМакс

Фонарик Gemini 3.1

0,25 доллара

1,50 доллара

1,75 доллара

Google

Qwen3.7-Plus

0,40 доллара

1,60 доллара

2,00 доллара

Alibaba Cloud

MiMo-V2.5

0,40 доллара

2,00 доллара

2,40 доллара

Сяоми МиМо

Grok 4.3 (низкий контекст)

1,25 доллара

2,50 доллара

3,75 доллара

xAI

MiMo-V2.5 Pro (≤256K)

1,00 долл.

3,00 доллара

4,00 доллара

Сяоми МиМо

Кими-К2.6

0,95 доллара

4,00 доллара

4,95 доллара

Муншот/Кими

GLM-5.2

1,40 доллара

4,40 доллара

5,80 долларов

З.ай

Grok 4.3 (высококонтекстный)

2,50 доллара

5,00 долларов

7,50 долларов

xAI

MiMo-V2.5 Pro (>256K)

2,00 доллара

6,00 долларов

8,00 долларов

Сяоми МиМо

Qwen3.7-Max

2,50 доллара

7,50 долларов

10,00 долларов

Alibaba Cloud

Вспышка Gemini 3.5

1,50 доллара

9,00 долларов

10,50 долларов

Google

Gemini 3.1 Pro Preview (≤200K)

2,00 доллара

12,00 долларов

14,00 долларов

Google

ГПТ-5.4

2,50 доллара

15,00 долларов

17,50 долларов

OpenAI

Gemini 3.1 Pro Preview (>200K)

4,00 доллара

18,00 долларов

22,00 долларов

Google

Клод Опус 4.8

5,00 долларов

25,00 долларов

30,00 долларов

Антропический

ГПТ-5.5

5,00 долларов

30,00 долларов

35,00 долларов

OpenAI

Клод Басня 5 / Клод Мифос 5

10,00 долларов

50,00 долларов

60,00 долларов

Антропический

Для дальнейшей оптимизации затрат на обработку данных с длительным контекстом Z.ai предлагает кэширование входных данных по цене всего 0,26 доллара США за миллион токенов, а также ограниченное по времени предложение бесплатного хранения кэшированных входных данных.

Резкий контраст между новаторами, использующими открытые весовые коэффициенты, и западными лабораториями, работающими в рамках собственных разработок, не остался незамеченным сообществом разработчиков.

На платформе X известный наблюдатель за ИИ Лисан аль Гаиб (@scaling01) утверждал, что «передовые лаборатории откровенно обманывают вас в вопросе ценообразования API».

В сообщении отмечалось, что в то время как такие масштабные открытые модели, как GLM-5.2 с 744 миллиардами параметров, взимают 4,40 доллара за миллион выходных токенов, а DeepSeek-V4-Pro (1,6 триллиона параметров) — всего 0,87 доллара, проприетарные модели требуют значительно большей наценки: Sonnet 4.6 и Opus 4.8 от Anthropic взимают 15 и 25 долларов соответственно, а GPT-5.5 от OpenAI стоит 30 долларов за выходной сигнал.

Подчеркивая, что разработчики, работающие по открытым моделям, получают прибыль, не полагаясь на новейшие «модные чипы Blackwell», комментатор предположил, что ведущие проприетарные лаборатории «вероятно, имеют маржу более 90% на данный момент».

Преимущества неизмененной лицензии MIT для корпоративного использования.

Наиболее существенным изменением в выпуске GLM-5.2 стало лицензирование. Компания Z.ai выпустила веса модели под открытой лицензией MIT, тем самым утвердив её как «чисто открытую» систему.

В технической документации компании прямо указано, что данная лицензия гарантирует «отсутствие региональных ограничений» и обеспечивает «технический доступ без границ».

Для руководителей технологических подразделений предприятий лицензия MIT означает, что программное обеспечение можно использовать, модифицировать и коммерциализировать без уплаты роялти или соблюдения ограничительных правил «допустимого использования», характерных для лицензий двойного назначения.

Это позволяет инженерным группам размещать передовые системы искусственного интеллекта на собственной суверенной инфраструктуре, полностью исключая зависимость от конкретного поставщика.

Теплый прием среди разработчиков ИИ и создателей инструментов.

Реакция разработчиков на релиз была незамедлительной и в подавляющем большинстве положительной.

Команда разработчиков Kilo Code подтвердила интеграцию с первого дня, опубликовав на X следующее сообщение: «GLM-5.2 запускается в Kilo Code с первого дня. Окно контекста 1M и режим максимального усилия уже доступны. Настройте параметры и приступайте!».

В среде разработки с открытым исходным кодом Cline IDE на платформе X выразили аналогичное мнение, отметив экономическое преимущество: «GLM-5.2 — первая модель с открытыми весами, которая преодолела отметку в 80% на Terminal-Bench и превосходит все остальные доступные модели с открытым исходным кодом. Она также превосходит Gemini, что делает её моделью передового уровня за небольшую часть стоимости. Открытые веса вернулись. Эта модель меняет правила игры. Доступна в Cline уже сейчас!».

Аналогичным образом, конкурирующий настольный агент с открытым исходным кодом Eigent AI также протестировал новые возможности модели на сложных рабочих процессах с участием агентов, отметив на X: «была поставлена действительно долгосрочная задача: исследование 30 компаний в 6 секторах инфраструктуры ИИ, структурирование данных в JSON, а затем создание интерактивного HTML-отчета… где 5.2 опережает: -> планы…».

Transform: Посмотрите, кто участвует в CTA

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

Оцените материал:

Читайте также
Новости робототехники Репортаж с ICRA 2026 из Вены Архив рубрики ~Обо всем~ Linux 7.1 положит конец эре процессоров Intel 486 и проведет серьезную очистку от устаревших файлов. Архив рубрики ~Обо всем~ Компания SpaceX покупает стартап Cursor, занимающийся разработкой программного обеспечения для искусственного интеллекта, за 60 миллиардов долларов. Новости робототехники Интернет Архив рубрики ~Обо всем~ Китайские материаловеды разработали санскрин для перовскитных солнечных элементов. Больше всего от излучения страдал тонкий транспортный слой Архив рубрики ~Обо всем~ Формула-1 в Испании: Стратегическая борьба в старом стиле по-прежнему может быть захватывающей. Новости робототехники Морские хищники: новейшие российские БЭКи и подводные дроны представили в Кронштадте Архив рубрики ~Обо всем~ Прошивка AMD AGESA 1.3.0.1b прилично снижает напряжение оперативной памяти Новости робототехники Компания Mobileye, поставщик технологий для беспилотных автомобилей, хочет снова стать частью революции роботакси. Архив рубрики ~Обо всем~ Голландская крайне правая партия выплатила компенсацию художнику, изменившему изображение с помощью ИИ. Архив рубрики ~Полезное~ Передовая платформа для создания видео с искусственным интеллектом Magic HourAI Архив рубрики ~Коротко из Telegram~ Cursor улетает в космос Сегодня SpaceX подписал обязывающее соглашение о… Архив рубрики ~Коротко из Telegram~ АСУ под прицелом   Лаборатория Касперского опубликовала большой отчет по… Архив рубрики ~Коротко из Telegram~ Для 6G уже печатают «зеркала» Ученые не только экспериментируют с… Новости робототехники Репортаж с ICRA 2026 из Вены Архив рубрики ~Обо всем~ Linux 7.1 положит конец эре процессоров Intel 486 и проведет серьезную очистку от устаревших файлов. Архив рубрики ~Обо всем~ Компания SpaceX покупает стартап Cursor, занимающийся разработкой программного обеспечения для искусственного интеллекта, за 60 миллиардов долларов. Новости робототехники Интернет Архив рубрики ~Обо всем~ Китайские материаловеды разработали санскрин для перовскитных солнечных элементов. Больше всего от излучения страдал тонкий транспортный слой Архив рубрики ~Обо всем~ Формула-1 в Испании: Стратегическая борьба в старом стиле по-прежнему может быть захватывающей. Новости робототехники Морские хищники: новейшие российские БЭКи и подводные дроны представили в Кронштадте Архив рубрики ~Обо всем~ Прошивка AMD AGESA 1.3.0.1b прилично снижает напряжение оперативной памяти Новости робототехники Компания Mobileye, поставщик технологий для беспилотных автомобилей, хочет снова стать частью революции роботакси. Архив рубрики ~Обо всем~ Голландская крайне правая партия выплатила компенсацию художнику, изменившему изображение с помощью ИИ. Архив рубрики ~Полезное~ Передовая платформа для создания видео с искусственным интеллектом Magic HourAI Архив рубрики ~Коротко из Telegram~ Cursor улетает в космос Сегодня SpaceX подписал обязывающее соглашение о… Архив рубрики ~Коротко из Telegram~ АСУ под прицелом   Лаборатория Касперского опубликовала большой отчет по… Архив рубрики ~Коротко из Telegram~ Для 6G уже печатают «зеркала» Ученые не только экспериментируют с…

Оставить комментарий