Вышел MiniMax-M3, превосходящий GPT-5.5 и Gemini 3.1 Pro по ключевым показателям производительности, при этом его стоимость составляет всего 5-10% от цены предыдущего устройства.

Карл Франзен

Графика M3 — Источник: VentureBeat, создано с помощью OpenAI ChatGPT-Images-2.0

В минувшие выходные в корпоративном ИИ произошли важные события: китайский стартап MiniMax в воскресенье вечером по восточному времени выпустил свою долгожданную модель обработки больших языков M3, сочетающую в себе передовые технологии программирования и производительность агентов с контекстным окном в 1 миллион токенов и нативной мультимодальностью, при этом стоимость модели значительно ниже, чем у ведущих проприетарных моделей. Цены начинаются всего с 20 долларов в месяц в рамках новых тарифных планов с подпиской на токены.

Руководство компании также объявило о планах распространения модели под лицензией с открытым исходным кодом, включая «открытые веса», что позволит бесплатно загружать и настраивать модель для корпоративного использования. Это произойдет в течение следующих 10 дней. На данный момент модель доступна через API MiniMax по специальной сниженной цене 0,3 доллара за 1 миллион входных токенов и 1,20 доллара за миллион выходных токенов (при использовании свежего кэша) в течение следующей недели — значительно превосходя по стоимости проприетарные решения таких американских гигантов, как Google, OpenAI и Anthropic, а также превосходя по производительности новейшие модели от первых двух компаний на отдельных тестах.

Даже при полной цене в 0,6/2,40 доллара за миллион входных/выходных токенов, MiniMax-M3 остается всего лишь на 8-20% дешевле ведущих запатентованных моделей, выпускаемых в США.

Традиционная модель разработки больших языковых моделей долгое время диктовала жесткий выбор: разработчики программного обеспечения могли либо получить доступ к высококачественным закрытым исходным кодам, доступным через ограниченные API, либо использовать гибкие и экономически эффективные открытые модели, которые не справляются с многоэтапными рассуждениями, сложными задачами кодирования и огромными массивами данных. MiniMax-M3 коренным образом переворачивает эту парадигму.

Объединяя эти две исторически разрозненные передовые возможности, M3 обеспечивает уровень всесторонней полезности, ранее доступный только в дорогостоящих экосистемах с закрытым исходным кодом, эффективно меняя базовые принципы работы систем с открытыми весами и значительно минимизируя вычислительные ресурсы, необходимые для выполнения сложных циклов разработки.

Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.

Модель	Вход	Выход	Общая стоимость	Источник
MiMo-V2.5 Flash	0,10 доллара	0,30 доллара	0,40 доллара	Сяоми МиМо
deepseek-v4-flash	0,14 доллара	0,28 доллара	0,42 доллара	DeepSeek
deepseek-v4-pro	0,435 доллара	0,87 доллара	1,305 доллара	DeepSeek
МиниМакс-М3	0,30 доллара	1,20 доллара	1,50 доллара (предложение действует ограниченное время)	МиниМакс
Фонарик Gemini 3.1	0,25 доллара	1,50 доллара	1,75 доллара	Google
MiMo-V2.5	0,40 доллара	2,00 доллара	2,40 доллара	Сяоми МиМо
Grok 4.3 низкий контекст	1,25 доллара	2,50 доллара	3,75 доллара	xAI
ГЛМ-5	1,00 долл.	3,20 доллара	4,20 доллара	З.ай
Кими-К2.6	0,95 доллара	4,00 доллара	4,95 доллара	Муншот/Кими
GLM-5.1	1,40 доллара	4,40 доллара	5,80 долларов	З.ай
Grok 4.3 высокий контекст	2,50 доллара	5,00 долларов	7,50 долларов	xAI
Qwen3.7-Max	2,50 доллара	7,50 долларов	10,00 долларов	Alibaba Cloud
Вспышка Gemini 3.5	1,50 доллара	9,00 долларов	10,50 долларов	Google
Gemini 3.1 Pro Preview ≤200K	2,00 доллара	12,00 долларов	14,00 долларов	Google
ГПТ-5.4	2,50 доллара	15,00 долларов	17,50 долларов	OpenAI
Gemini 3.1 Pro Preview >200K	4,00 доллара	18,00 долларов	22,00 долларов	Google
Клод Опус 4.8	5,00 долларов	25,00 долларов	30,00 долларов	Антропический
ГПТ-5.5	5,00 долларов	30,00 долларов	35,00 долларов	OpenAI

Новая технология MiniMax Sparse Attention (MSA) помогает снизить стоимость модели.

В основе эффективности модели лежит архитектурный отход от классических сетей Transformer. Стандартные механизмы внимания масштабируются квадратично ($O(N^2)$), что означает, что вычислительные и финансовые затраты резко возрастают по мере увеличения длины текстовых входных данных.

Для борьбы с этим «внутренним недостатком» команда инженеров внедряет MiniMax Sparse Attention (MSA) — простую, расширяемую модель разреженного внимания.

Чтобы наглядно представить это нововведение, вообразите, что традиционное полное внимание уделяется редактору, который каждый раз с нуля перечитывает всю библиотеку, чтобы проверить хотя бы одно предложение. MSA же действует как интеллектуальный индексатор , используя этап предварительной фильтрации для разделения матриц «ключ-значение» (KV) на высокоточные блоки.

На уровне оператора MSA использует подход «KV outer gather Q». Система обрабатывает блоки KV как внешний цикл, динамически агрегируя только конкретные запросы, которые к ним обращаются. Поскольку каждый блок данных считывается ровно один раз, а доступ к памяти остается строго непрерывным, загрузка оборудования резко возрастает.

В ходе внутренних испытаний MSA показала более чем в 4 раза более высокую скорость работы по сравнению с альтернативными решениями с открытым исходным кодом, такими как Flash-Sparse-Attention или flash-moba.

При обработке максимальной длины контекста в 1 миллион токенов вычислительная нагрузка M3 на один токен снижается до 1/20 от показателя предыдущего поколения, что приводит к 9-кратному ускорению на этапе предварительного заполнения и 15-кратному увеличению производительности во время декодирования.

Вместо того чтобы брать предварительно обученную текстовую нейронную сеть и объединять ее с отдельной моделью компьютерного зрения, компания MiniMax разработала M3 как изначально многомодальную систему с нуля.

Компания модернизировала свой механизм обработки данных, чтобы создавать последовательности текста, изображений и визуальных компонентов, естественным образом чередующиеся между собой, увеличив общий объем корпуса для предварительного обучения до более чем 100 триллионов токенов.

Такая глубокая согласованность данных позволяет модели преобразовывать сложные визуальные геометрические объекты, такие как программные схемы или карты координат, в структурный код без потери контекстной точности. В стандартизированных тестах M3 подтверждает правильность этого инженерного подхода.

Модель демонстрирует результат 59,0% в SWE-Bench Pro , метрике автономного агента, что ставит ее впереди закрытых моделей, таких как GPT-5.5 и Gemini 3.1 Pro. Она достигает 66,0% в Terminal Bench 2.1, 74,2% в MCP Atlas и 83,5% в BrowseComp, превосходя результат Claude Opus 4.7 в 79,3% в автономном просмотре и поиске информации.

Сравнительная таблица результатов тестов MiniMax-M3. Источник: MiniMax.

Однако, если сравнить с недавно выпущенной компанией Anthropic премиальной моделью Claude Opus 4.8, представленной на прошлой неделе, становится очевидным конкурентный потолок эффективной модели M3 с разреженным вниманием при сравнении с аналогичными, ресурсоемкими тестовыми агентами.

В области чистого изменения кода в SWE-Bench Pro результат M3 в 59,0% оказался ниже, чем у Opus 4.8, показавшего лучший результат в 69,2%.

Аналогичное снижение производительности наблюдается и в автоматизированных системных средах при использовании Terminal-Bench 2.1; хотя показатель выполнения терминала M3 в 66,0% практически равен базовому показателю предыдущего поколения Opus 4.7 ( 66,1%), он уступает обновленной архитектуре Opus 4.8, которая достигает 74,6%.

Кроме того, оценки, отслеживающие непрерывное взаимодействие с графическим интерфейсом пользователя в песочнице OSWorld-Verified, показывают, что автоматизированное использование компьютеров системой M3 составляет 70,0%, по сравнению с более высоким показателем валидации в 83,4%, достигнутым Opus 4.8.

Эти стандартизированные оценки иллюстрируют структурные компромиссы, определяющие нынешнюю экосистему: системы с закрытым исходным кодом, такие как Opus 4.8, сохраняют абсолютное преимущество в обработке сверхсложных векторов рассуждений, в то время как M3 обеспечивает высокоэффективный базовый уровень локальной автоматизированной работы первого уровня без дополнительных затрат на подписку на закрытый API.

В сравнении с мощными метриками вывода новой модели DeepSeek-V4 Pro Max с открытыми весами, M3 сохраняет свои позиции в основных категориях агентов, одновременно демонстрируя незначительные преимущества в специализированном синтезе кода.

В матрице оценки эффективности программного обеспечения SWE-Bench Pro , показатель эффективности разрешения M3, равный 59,0%, немного превосходит результат DeepSeek-V4 Pro Max, составляющий 55,4%.

Однако конкуренция усиливается в средах командной строки; в тестах Terminal Bench DeepSeek-V4 Pro Max немного опережает конкурентов, демонстрируя точность выполнения 67,9% против 66,0% у M3.

В симуляциях веб-оркестрации и просмотра веб-страниц в открытом мире обе архитектуры достигают практически статистического паритета: M3 показывает результат 83,5% на BrowseComp по сравнению с 83,4% у DeepSeek.

Аналогично, в рамках системы оценки использования инструментов MCP Atlas, M3 демонстрирует небольшое преимущество, набрав 74,2% против 73,6% у DeepSeek.

Такое тесное соответствие демонстрирует, что, хотя DeepSeek обрабатывает огромный объем параметров в 1,6 триллиона с помощью специализированных режимов рассуждений, требующих больших усилий, механизм разреженного внимания с блочной фильтрацией в MiniMax обеспечивает непосредственно конкурентоспособную эффективность выполнения без необходимости масштабирования активации параметров.

Агент MiniMax Code AI предоставляет возможности для работы с командой Agentic.

MiniMax преобразует эти архитектурные преимущества в непосредственную пользу благодаря обновленному набору продуктов, разделенному на автономные приложения, настраиваемые уровни подписки и базовую инфраструктуру для разработчиков. Для управления процессом для конечных пользователей флагманской реализацией является MiniMax Code — продукт на основе ИИ-агента, разработанный для максимального использования многошаговых возможностей M3.

Работая через веб-интерфейс или нативные настольные приложения, MiniMax Code управляет «командой агентов», способной разбивать масштабные инженерные задачи на многоэтапные, параллельно выполняемые рабочие процессы.

Система основана на цикле взаимодействия «Производитель + Верификатор». Пока один экземпляр агента генерирует код, вторичный экземпляр верификатора активно тестирует и анализирует результаты выполнения, позволяя сети самокорректироваться и работать автономно в течение нескольких дней без участия человека. Благодаря встроенной визуальной поддержке, MiniMax Code поддерживает прямое использование на компьютере.

Разработчик может отправить голосовую команду через свой телефон, чтобы модель открыла локализованный корпоративный ERP-клиент и выполнила пакетное заполнение таблиц данных непосредственно из открытой электронной таблицы Excel.

Для пользовательских настроек разработчики могут напрямую интегрировать M3 в существующие рабочие процессы, используя ключ API (sk-cp), совместимый с распространенными альтернативными средами разработки, такими как Claude Code, Cursor, Roo Code и Cline. API также предоставляет переключаемый «режим обдумывания».

При включении M3 направляет вычислительную мощность на глубокое логическое мышление и долгосрочное планирование; при отключении модель работает с минимальной задержкой для быстрого завершения ввода текста. Сопутствующий план Token Plan моделирует агрессивную ценовую стратегию, основанную на общих многомодальных квотах. Оплата производится ежегодно, доступны три варианта:

Плюс (20 долларов в месяц) : предоставляет около 1,7 миллиарда токенов в месяц и обрабатывает 3–4 одновременно работающих агента.
Max ($50/месяц) : Предоставляет около 5,1 млрд токенов в месяц, управляет 4–5 одновременно работающими агентами и добавляет 3 автоматизированных видеоролика в день через Hailuo 2.3.
Ultra (120 долларов в месяц) : предоставляет около 9,8 млрд токенов в месяц, поддерживает работу 6–7 агентов одновременно и расширяет емкость видео до 5 роликов в день.

Открытые веса делают M3 гораздо более привлекательным для использования в корпоративной среде.

Заявление MinMax о выпуске M3 под лицензией с открытым доступом к весам — с запуском весов и технической документации на HuggingFace и GitHub в течение 10 дней — имеет значительный стратегический вес для менеджеров корпоративной инфраструктуры.

Однако до сих пор точно не определено, под какой лицензией будут доступны эти веса и будет ли разрешено их использование потребителями, например, под лицензией MIT, Apache 2.0 или новой лицензией OpenMDW. Если да, то расчеты будут выглядеть следующим образом:

Характеристика / Атрибут модели	Закрытые API-провайдеры (например, GPT-5.5, Opus 4.7)	Открытый весовой щит Frontier (MiniMax M3)
Конфиденциальность данных и границы	Требует запросов к внешним API; возможны различные способы получения данных.	Полная локальная изоляция; работает исключительно внутри частных пользовательских кластеров.
Индивидуальная оптимизация	Ограничено базовыми оболочками для тонкой настройки или оперативной разработкой.	Полный контроль над конвейером обработки данных; архитектура позволяет осуществлять глубокую настройку адаптеров/весов.
Согласованность вектора затрат	Привязано к бессрочной модели ценообразования за токен в рамках API.	Вычислительные требования снижены в 20 раз; это позволяет преодолеть ограничения по аппаратному обеспечению.

Предоставляя сообществу непосредственно веса базовой модели, MiniMax отходит от закрытого подхода, предпочитаемого крупными американскими лабораториями искусственного интеллекта.

Для корпоративных пользователей, связанных строгими правилами соответствия и конфиденциальности, открытые весовые коэффициенты означают, что они могут запускать M3 локально на внутреннем оборудовании.

Такая конфигурация полностью исключает риск утечки данных, связанный с общедоступными API. Кроме того, она позволяет инженерным группам проводить специализированные этапы тонкой настройки, модифицировать внутреннюю архитектуру или внедрять специализированные системные подсказки глубоко в слои модели, превращая готовую систему в высокоэффективный проприетарный актив.

Первоначальная реакция общественности в целом положительная.

Экосистема разработчиков незамедлительно отреагировала на результаты эксплуатационных испытаний M3, особо отметив его способность к автономному управлению в долгосрочной перспективе и оптимальное соотношение цены и производительности.

Одним из главных пунктов обсуждения стал 12-часовой автоматизированный тест проверки, в ходе которого компании M3 было поручено воспроизвести статью, получившую награду за лучшую научную работу на конференции ICLR 2025, под названием «Динамика обучения при тонкой настройке LLM» .

Как отметила исследовательница MiniMax @MikaStars39 на X:

«M3 работал автономно почти 12 часов, самостоятельно создав 18 коммитов и 23 экспериментальных рисунка, и запустил основные эксперименты:

Это соответствовало прогнозируемым тенденциям вероятности на этапе SFT.
Четко наблюдался эффект сжатия, являющийся центральным элементом экспериментов DPO.
подтвердили эффективность предложенного в оригинальной статье метода смягчения последствий «Extension».

Одновременно с этим создатели инструментов для разработчиков подчеркнули практические экономические преимущества нового механизма внимания в модели. Официальная команда разработчиков инструментария для создания агентного ИИ Cline опубликовала сообщение, подтверждающее совместимость с первого дня, заявив:

«Новая MiniMax-M3 — это их первая модель, обладающая возможностью кодирования контекста в 1 миллион символов, мультимодального и агентного обучения. Поздравляем @MiniMax_AI с прорывом в архитектуре с разреженным вниманием, которая сократила вычислительные ресурсы и затраты в 20 раз по сравнению с предыдущим поколением».

Резкое снижение затрат на выполнение меняет представление разработчиков о соотношении финансовых вложений и возможностей. Технологический обозреватель @jumperz описал это изменение, отметив, как M3 нарушает историческую тенденцию ценообразования в сфере машинного обучения:

Устраняя ограничения масштабирования контекста за счет фундаментальной оптимизации на уровне механизма внимания, а не путем грубой оптимизации аппаратного обеспечения, MiniMax создал высокоэффективную базовую модель с открытым исходным кодом. M3 демонстрирует, что следующий этап разработки агентов будет определяться не только большими наборами данных, но и эффективными архитектурными решениями, которые сделают производительность на передовом уровне доступной для более широкого сообщества разработчиков открытого исходного кода.

Для предприятий, занимающихся разработкой автономного программного обеспечения или агентской инфраструктуры, MiniMax M3 обеспечивает оптимальное соотношение цены и качества.

Несмотря на то, что DeepSeek-V4 Pro имеет микроскопическое ценовое преимущество в 0,195 доллара за миллион токенов, MiniMax M3 оправдывает свою незначительную надбавку за счет более высоких показателей автономной разработки программного обеспечения (59,0% SWE-Bench Pro).

Что еще более важно, поскольку M3 — это модель с открытыми весами, расчет выходит далеко за рамки диаграммы API. Развертывая веса M3 локально внутри частных корпоративных облаков, организации полностью обходят отслеживание исходящего трафика из облака, устраняют структурную зависимость от поставщика и могут внедрять собственные модели кэширования префиксов на внутреннем оборудовании. Такой технический подход превращает высокоэффективный бюджет времени выполнения в постоянный, частный корпоративный актив.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Gemini, GPT, Minimax, PRO, Вышел, новости, Превосходящий

Вышел MiniMax-M3, превосходящий GPT-5.5 и Gemini 3.1 Pro по ключевым показателям производительности, при этом его стоимость составляет всего 5-10% от цены предыдущего устройства.

Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.

Новая технология MiniMax Sparse Attention (MSA) помогает снизить стоимость модели.

Агент MiniMax Code AI предоставляет возможности для работы с командой Agentic.

Открытые веса делают M3 гораздо более привлекательным для использования в корпоративной среде.

Первоначальная реакция общественности в целом положительная.

Подпишитесь, чтобы получать самые свежие новости!

Добавить комментарий Отменить ответ

Новости других рубрик

Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.

Новая технология MiniMax Sparse Attention (MSA) помогает снизить стоимость модели.

Агент MiniMax Code AI предоставляет возможности для работы с командой Agentic.

Открытые веса делают M3 гораздо более привлекательным для использования в корпоративной среде.

Первоначальная реакция общественности в целом положительная.

Подпишитесь, чтобы получать самые свежие новости!

Похожие записи

Добавить комментарий Отменить ответ

Новости других рубрик