Архив рубрики ~Лента новостей~

Новая открытая платформа для программирования искусственного интеллекта от Xiaomi, MiMo Code, превосходит Claude Code в сверхдлинных задачах, состоящих из более чем 200 шагов.

Новая открытая платформа для программирования искусственного интеллекта от Xiaomi, MiMo Code, превосходит Claude Code в сверхдлинных задачах, состоящих из более чем 200 шагов.

Карл Франзен

Белый робот стоит перед оранжевым коридором с мониторами.

Источник: VentureBeat, создано с помощью Google Nano Banana 2

Команда разработчиков MiMo AI от Xiaomi открыла исходный код MiMo Code V0.1.0, встроенного в терминал ИИ-помощника для программирования, который, по словам китайского электронного гиганта, превосходит Claude Code от Anthropic по ключевым показателям производительности агентного программирования, особенно в задачах с длительным горизонтом выполнения и множеством шагов (более 200 шагов) — по крайней мере, согласно данным внутренней бета-версии и опросу 576 разработчиков.

Кроме того, компания предлагает ограниченный по времени бесплатный доступ к MiMo-V2.5, своей флагманской многомодальной модели с контекстным окном на миллион токенов, для начала работы с которой не требуется регистрация.

О выпуске было объявлено 10 июня 2026 года в сообщении в социальной сети X от официального аккаунта @XiaomiMiMo, в котором инструмент описывался как «больше, чем просто помощник по программированию на основе ИИ в вашем терминале — это самый умный партнер по программированию, с которым вам когда-либо доведется работать».

MiMo Code теперь доступен на GitHub под лицензией MIT и устанавливается одной командой в терминале (curl -fsSL https://mimo.xiaomi.com/install | bash) на macOS и Linux или через npm (npm install -g @mimo-ai/cli) на Windows.

Этот проект является форком открытого агента OpenCode, который Xiaomi расширила собственной архитектурой памяти, режимами рабочего процесса и средой разработки моделей.

Конец амнезии у агентов ИИ, занимающихся программированием?

Как наверняка подтвердит любой увлеченный программист, работающий с искусственным интеллектом, его возможности ухудшаются при длительных рабочих сессиях: по мере заполнения контекстного окна ранее принятые решения, соглашения и состояние задачи сжимаются или теряются полностью, вынуждая разработчиков заново объяснять свои проекты.

Xiaomi утверждает, что такой подход обречен на провал в больших масштабах. «Нам нужна не более качественная компрессия, а четкий механизм хранения и извлечения данных, который определяет, какая информация должна быть записана в постоянные структуры и когда ее следует извлекать», — отметила команда MiMo в своем блоге, посвященном запуску продукта.

MiMo Code решает эту проблему с помощью системы межсессионной памяти, работающей на основе полнотекстового поиска SQLite FTS5 и охватывающей четыре уровня: память проекта (постоянный файл MEMORY.md), контрольные точки сессии, временные заметки и журналы выполнения каждой задачи.

Здесь ключевое значение имеет ведение записей: вместо того, чтобы заставлять основного агента кодирования приостанавливать свою работу для ведения записей, система использует независимого субагента, занимающегося созданием контрольных точек.

Представьте себе, что главный программист — это строительный подрядчик, работающий над возведением огромного особняка вместе с архитектором, субагентом, устанавливающим контрольные точки. Пока главный программист сосредоточен на возведении здания, субагент обновляет чертежи в режиме реального времени, отмечая принятые решения, проблемы и фактическую местность по мере продвижения строительного проекта.

Когда контекстное окно приближается к своим пределам — например, подрядчик теряется в недостроенном особняке — он может обратиться к субагенту и снова найти свое место. В случае с MiMo Code система просто восстанавливает окружение из структурированных контрольных точек с соответствующим контекстом, обеспечивая отсутствие потери оперативного темпа.

Систему дополняют два механизма самосовершенствования: команда /dream, которая периодически (примерно каждые семь дней) анализирует историю сессий, удаляет дубликаты и сжимает их в долговременную память, и функция «distill», которая извлекает из прошлых сессий повторяющиеся рабочие процессы, которые можно автоматизировать, следуя аналогичному подходу, недавно примененному OpenAI и Anthropic в своих различных моделях.

Впечатляющие результаты в тестах по разработке программного обеспечения (SWE).

Согласно результатам тестов, опубликованным в техническом блоге Xiaomi, MiMo Code в паре с MiMo-V2.5-Pro превзошёл Claude Code в паре с Claude Sonnet 4.6 по всем трём протестированным параметрам:

Сравнение производительности MiMo Code и Claude Code в бенчмарке

Сравнение результатов тестов MiMo Code и Claude Code. Источник: Xiaomi.

  • Проверено SWE-bench: 82% против 79%

  • SWE-bench Pro: 62% против 55%

  • Результаты в заключительном раунде 2: 73% против 69%

Сама по себе проводка обеспечивает измеримую долю прироста производительности. При использовании одной и той же модели MiMo-V2.5-Pro в обеих проводках, MiMo Code показала 62% в SWE-bench Pro против 57% у Claude Code и 73% в Terminal Bench 2 против 68% — примерно по пять пунктов в каждом случае, что объясняется исключительно системой агентов, а не моделью.

Примечательно, что Xiaomi не опубликовала сравнения с OpenAI Codex или Google Gemini CLI — единственным упомянутым конкурентом во всех материалах является Claude Code, что является показательным выбором целевого бенчмарка.

Независимые контрольные точки объясняют это. В официальной таблице лидеров Terminal-Bench 2.0, поддерживаемой на tbench.ai, CLI от OpenAI Codex, работающий с GPT-5.5, набирает 82,2% — примерно на девять пунктов выше заявленных MiMo Code 73%, — а в собственном заявлении OpenAI о GPT-5.5 говорится о 82,7% в том же бенчмарке.

Однако в SWE-Bench Pro ситуация меняется: OpenAI сообщает о результатах GPT-5.5 в 58,6%, что ниже заявленных 62% у MiMo Code + MiMo-V2.5-Pro. (MiMo Code пока не фигурирует ни в одном из официальных рейтингов, и сравнение результатов собственных запусков с результатами, представленными в рейтинге, сопряжено с обычными ограничениями по настройке.)

Возможно, более интересным, чем результаты офлайн-тестов, является следующее: Xiaomi заявляет, что в ходе внутреннего бета-тестирования провела двойное слепое A/B-тестирование с участием 576 разработчиков, работающих в 474 реальных частных репозиториях, и получила 1213 пар результатов, сравниваемых напрямую с Claude Code с использованием одной и той же целевой модели.

При выполнении менее 200 шагов обе системы показывают примерно равные результаты — 50/50, но после 200 шагов процент успешных решений MiMo Code превысил 65%, что подтверждает тезис компании о том, что ее архитектура управления памятью и состоянием окупается именно при выполнении задач с длительным горизонтом планирования.

Сама компания Xiaomi признает, что стандартные бенчмарки «по-прежнему измеряют способность к решению задач за один раз» и не отражают цели многопользовательского проектирования инструмента.

Как всегда, это данные, предоставленные самими поставщиками, которые не были независимо проверены, и прямое сравнение различных систем зависит от конфигурации. Но эти заявления соответствуют более широкой отраслевой тенденции: проектирование каркаса и систем становится столь же важным, как и возможности самой модели, для повышения производительности агентного кодирования.

Простая интеграция с существующими системами разработчиков и голосовым управлением.

С точки зрения пользовательского опыта, MiMo Code разработан для работы там, где уже работают разработчики. Он функционирует непосредственно в терминале, читая и записывая файлы, выполняя команды и управляя Git.

Инструмент не требует никакой предварительной настройки и автоматически подключается к «MiMo Auto» — бесплатному в течение ограниченного времени каналу, работающему на основе многомодальной модели MiMo V2.5 от Xiaomi, которая может похвастаться огромным контекстным окном в миллион токенов. Для разработчиков, переходящих из существующих сред, переход проходит без проблем: MiMo Code автоматически импортирует серверы MCP, пользовательские навыки и конфигурации API из Claude Code.

К числу других примечательных особенностей относятся:

  • Режим создания: Нажатие клавиши Tab переключает агента в рабочий процесс, основанный на спецификации, в котором разработчик описывает общую цель, а система автономно выполняет полный цикл разработки — проектирование, планирование, кодирование, тестирование и проверку — следуя стратегии, которую Xiaomi описывает как «тщательное планирование на начальном этапе, стабильная проверка позже».

  • Голосовое управление: Благодаря технологии распознавания речи Xiaomi MiMo-ASR с функцией обнаружения голосовой активности TenVAD, разработчики могут диктовать и изменять инструкции устно, а также произносить команды, такие как «отправить» и «выполнить», для полностью автономной работы (доступно для авторизованных пользователей).

По данным Xiaomi, преимущества, обеспечиваемые самим агентским модулем, измеримы. При использовании одной и той же базовой модели MiMo в обоих модулях, компания утверждает, что MiMo Code показал 62% в SWE-Bench Pro против 57% у Claude Code и 73% в Terminal Bench 2 против 68% у Claude Code — примерно на пять процентных пунктов лучше в каждом случае, что объясняется исключительно агентской системой, а не моделью.

Как всегда, это данные, предоставленные самими поставщиками, которые не были независимо проверены, и прямое сравнение различных вариантов программного обеспечения зависит от конфигурации. Но это утверждение соответствует более широкой отраслевой тенденции: проектирование каркаса и программного обеспечения становится столь же важным, как и возможности самой модели, для повышения производительности агентного кодирования.

Агрессивно доступные цены

Для многих разработчиков наибольший интерес может представлять то, что входит в комплект.

MiMo Code поставляется с «MiMo Auto», каналом без необходимости настройки, предоставляющим бесплатный, ограниченный по времени доступ к MiMo-V2.5 — изначально многомодальной модели, выпущенной Xiaomi в конце апреля 2026 года, — разреженной конструкции, сочетающей в себе множество экспертов, с общим количеством параметров в 310 миллиардов (всего 15 миллиардов активных на один вывод) и контекстным окном в 1 миллион токенов, которую компания позиционирует как аналогичную Anthropic's Claude Sonnet 4.6 в многомодальной агентной работе.

Как сообщало издание VentureBeat в апреле, когда было запущено семейство MiMo-V2.5, эти модели имеют лицензию MIT и являются одними из самых эффективных и доступных для выполнения агентских задач.

Более крупная модель MiMo-V2.5-Pro — смесь экспертов с 1,02 триллионом параметров, 42 миллиардами активных параметров и гибридной архитектурой внимания — лидировала в области открытого исходного кода в бенчмарке ClawEval от Xiaomi, показав 63,8% успеха при потреблении всего около 70 000 токенов на траекторию, что примерно на 40–60% меньше, чем требовалось для достижения сопоставимых результатов Anthropic Claude Opus 4.6, Google Gemini 3.1 Pro или OpenAI GPT-5.4.

Примечательно, что постобучение V2.5-Pro было специально разработано для привития «осведомленности о структуре агента» — обучения модели управлению собственной памятью и контекстом в рамках агентских структур, таких как Claude Code или OpenCode, — поэтому создание разработанной Xiaomi структуры агента, оптимизированной для этой возможности, стало логичным следующим шагом.

Ценообразование также отличается агрессивной ценовой политикой: MiMo-V2.5 начинается с 0,40 доллара за миллион входных токенов и 2,00 доллара за миллион выходных токенов, в то время как V2.5-Pro стоит 1,00/3,00 доллара за миллион (вход/выход) до 256 тыс. контекстов, а затем удваивается, при этом попадания в кэш снижают стоимость ввода до 0,20–0,40 доллара за миллион, что делает его одним из самых дешевых моделей Frontier, доступных в мире.

Сводка цен на API для моделей искусственного интеллекта VentureBeat Frontier.

Модель

Вход

Выход

Общая стоимость

Источник

MiMo-V2.5 Flash

0,10 доллара

0,30 доллара

0,40 доллара

Сяоми МиМо

deepseek-v4-flash

0,14 доллара

0,28 доллара

0,42 доллара

DeepSeek

deepseek-v4-pro

0,435 доллара

0,87 доллара

1,305 доллара

DeepSeek

МиниМакс-М3

0,30 доллара

1,20 доллара

1,50 доллара

МиниМакс

Фонарик Gemini 3.1

0,25 доллара

1,50 доллара

1,75 доллара

Google

Qwen3.7-Plus

0,40 доллара

1,60 доллара

2,00 доллара

Alibaba Cloud

MiMo-V2.5

0,40 доллара

2,00 доллара

2,40 доллара

Сяоми МиМо

Grok 4.3 (низкий контекст)

1,25 доллара

2,50 доллара

3,75 доллара

xAI

MiMo-V2.5 Pro (≤256K)

1,00 долл.

3,00 доллара

4,00 доллара

Сяоми МиМо

ГЛМ-5

1,00 долл.

3,20 доллара

4,20 доллара

З.ай

Кими-К2.6

0,95 доллара

4,00 доллара

4,95 доллара

Муншот/Кими

GLM-5.1

1,40 доллара

4,40 доллара

5,80 долларов

З.ай

Grok 4.3 (высококонтекстный)

2,50 доллара

5,00 долларов

7,50 долларов

xAI

MiMo-V2.5 Pro (>256K)

2,00 доллара

6,00 долларов

8,00 долларов

Сяоми МиМо

Qwen3.7-Max

2,50 доллара

7,50 долларов

10,00 долларов

Alibaba Cloud

Вспышка Gemini 3.5

1,50 доллара

9,00 долларов

10,50 долларов

Google

Gemini 3.1 Pro Preview (≤200K)

2,00 доллара

12,00 долларов

14,00 долларов

Google

ГПТ-5.4

2,50 доллара

15,00 долларов

17,50 долларов

OpenAI

Gemini 3.1 Pro Preview (>200K)

4,00 доллара

18,00 долларов

22,00 долларов

Google

Клод Опус 4.8

5,00 долларов

25,00 долларов

30,00 долларов

Антропический

ГПТ-5.5

5,00 долларов

30,00 долларов

35,00 долларов

OpenAI

Клод Басня 5 / Клод Мифос 5

10,00 долларов

50,00 долларов

60,00 долларов

Антропический

Для разработчиков, которым вообще не нужны модели Xiaomi, MiMo Code также поддерживает сторонние бэкэнды — включая планы токенов от DeepSeek, Kimi от Moonshot и GLM от Zhipu — наряду с любым API, совместимым с OpenAI, что отражает гибкость OpenCode в использовании собственных моделей.

Войны агентов по программированию в терминальном ИИ приобретают глобальный масштаб.

MiMo Code выходит на все более насыщенный рынок терминалов для разработки программного обеспечения: Claude Code от Anthropic, Codex CLI от OpenAI, Gemini CLI от Google, а также проекты с открытым исходным кодом, такие как OpenCode и Aider.

Новинкой является новый участник рынка. Xiaomi — третий по величине в мире производитель смартфонов с быстрорастущим бизнесом по производству электромобилей — методично развивает свое подразделение MiMo AI с момента выпуска модели MiMo-7B в апреле 2025 года, за которой последовали серия MiMo-VL для обработки визуальной информации и языков, MiMo-V2-Flash, MiMo-V2-Pro с триллионом параметров в марте 2026 года и флагманское семейство V2.5 в апреле.

Инициативу возглавляет Фули Луо, ветеран революционного проекта R1 компании DeepSeek, который охарактеризовал стремление Xiaomi к освоению новых горизонтов как «тихую засаду» и поддержал ее, предоставив разработчикам 100 триллионов бесплатных токенов, о чем было объявлено одновременно с запуском версии 2.5.

Эта стратегия хорошо известна по DeepSeek, Qwen от Alibaba, MiniMax и серии Kimi от Moonshot AI: выпускать действительно эффективные модели и инструменты под разрешительными лицензиями по ценам, значительно ниже тех, что действуют в американских лабораториях, и превращать полученное внимание разработчиков в устойчивую экосистему.

Сочетая агентскую платформу с открытым исходным кодом и бесплатную модель передового уровня, Xiaomi фактически устраняет как лицензионные, так и эксплуатационные расходы — по крайней мере, на данный момент.

Что это значит для предприятий и лиц, принимающих технические решения?

Для руководителей инженерных подразделений MiMo Code — это вариант для оценки с низким уровнем риска и потенциально высокой ценностью: лицензирование в стиле MIT позволяет вносить изменения и интегрировать продукт в коммерческую деятельность, происхождение от OpenCode означает возможность проверки архитектуры, а поддержка собственной модели позволяет использовать его с внутренним утвержденным конечным устройством, а не с облаком Xiaomi.

Система постоянной памяти решает реальную и широко распространенную проблему в рабочих процессах разработки агентов — проблему, которую конкуренты также стремятся решить.

Противоположные соображения: модель доступа «бесплатно в течение ограниченного времени» по определению является временной и направляет контекст кода через серверы Xiaomi, что неприемлемо для организаций со строгими правилами размещения данных или IP-адресов; преимущество в бенчмарке над Claude Code заявлено самими разработчиками; а номер версии V0.1.0 точно отражает то, что он говорит о зрелости продукта.

Командам, на которые распространяются ограничения правительства США в отношении закупок китайских технологических компаний, также следует учитывать этот контекст, прежде чем принимать решение.

Transform: Посмотрите, кто участвует в CTA

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Интеллекта, Искусственного, Новая, новости, Открытая, Платформа, Программирования
Читайте также
Архив рубрики ~Обо всем~ Теперь Deezer помогает пользователям находить музыку, созданную с помощью ИИ, на других стриминговых платформах. Архив рубрики ~Коротко из Telegram~ Xiaomi выпустили MiMo Code — конкурента Claude, который обходит агента… Архив рубрики ~Коротко из Telegram~ ⚡️ Главными новинками стали Gemini 3.5 и Gemini Omni. Новые… Архив рубрики ~Коротко из Telegram~ ➡️ OpenAI представила Sites в Codex — инструмент, который позволяет… Архив рубрики ~Обо всем~ Лучшие предложения Samsung в рамках Prime Day: значительные скидки на телефоны, планшеты и многое другое от Galaxy. Архив рубрики ~Обо всем~ Лучшие умные термостаты 2026 года: готовьтесь к жаре! Архив рубрики ~Обо всем~ Прекратите возвращать плоский текст из PDF-файлов: реляционная структура, необходимая для RAG. Архив рубрики ~Обо всем~ Компания Framework задерживает поставки ноутбуков Laptop 13 Pro на месяц. Архив рубрики ~Обо всем~ Все анонсы с конференции Apple WWDC 2026 — включая Siri, бета-версию iOS 27 для разработчиков и многое другое. Архив рубрики ~Обо всем~ Чемпионат мира по футболу FIFA 2026: как смотреть все матчи в США без кабельного телевидения Архив рубрики ~Обо всем~ PySpark для начинающих: за пределами основ Архив рубрики ~Обо всем~ YouTube расширяет возможности обмена личными сообщениями на территорию США. Архив рубрики ~Обо всем~ Три ключевых показателя составляют «городской пульс» города. Архив рубрики ~Обо всем~ Поддержит ли ваш iPhone искусственный интеллект Siri? Ответ неясен. Архив рубрики ~Обо всем~ Теперь Deezer помогает пользователям находить музыку, созданную с помощью ИИ, на других стриминговых платформах. Архив рубрики ~Коротко из Telegram~ Xiaomi выпустили MiMo Code — конкурента Claude, который обходит агента… Архив рубрики ~Коротко из Telegram~ ⚡️ Главными новинками стали Gemini 3.5 и Gemini Omni. Новые… Архив рубрики ~Коротко из Telegram~ ➡️ OpenAI представила Sites в Codex — инструмент, который позволяет… Архив рубрики ~Обо всем~ Лучшие предложения Samsung в рамках Prime Day: значительные скидки на телефоны, планшеты и многое другое от Galaxy. Архив рубрики ~Обо всем~ Лучшие умные термостаты 2026 года: готовьтесь к жаре! Архив рубрики ~Обо всем~ Прекратите возвращать плоский текст из PDF-файлов: реляционная структура, необходимая для RAG. Архив рубрики ~Обо всем~ Компания Framework задерживает поставки ноутбуков Laptop 13 Pro на месяц. Архив рубрики ~Обо всем~ Все анонсы с конференции Apple WWDC 2026 — включая Siri, бета-версию iOS 27 для разработчиков и многое другое. Архив рубрики ~Обо всем~ Чемпионат мира по футболу FIFA 2026: как смотреть все матчи в США без кабельного телевидения Архив рубрики ~Обо всем~ PySpark для начинающих: за пределами основ Архив рубрики ~Обо всем~ YouTube расширяет возможности обмена личными сообщениями на территорию США. Архив рубрики ~Обо всем~ Три ключевых показателя составляют «городской пульс» города. Архив рубрики ~Обо всем~ Поддержит ли ваш iPhone искусственный интеллект Siri? Ответ неясен.

Оставить комментарий

Подписка на рассылку

Получайте свежие новости и идеи на почту. Без спама — только самое интересное.

Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.