Компания Meituan выложила в открытый доступ LongCat-2.0, модель агентного кодирования с производительностью 1,6 Тбит/с, которая лидирует в разработке OpenRouter и полностью обучена на китайских чипах.
Карл Франзен
Несколько часов назад китайская компания Meituan, разработчик приложения для доставки, официально представила LongCat-2.0 на GitHub, Hugging Face и своей собственной платформе, раскрыв, что эта модель является вычислительным движком, лежащим в основе «Owl Alpha» — анонимной скрытой модели, которая последние два месяца лидирует в мировых рейтингах разработчиков на OpenRouter.
Разработанная для коренного подрыва доминирования закрытого программного обеспечения в сфере автономной разработки программного обеспечения, система Mixture-of-Experts (MoE) с 1,6 триллионами параметров предоставляет общедоступное контекстное окно с 1 миллионом токенов под весьма либеральной, коммерчески жизнеспособной лицензией корпоративного уровня MIT.
Коммерческий доступ к архитектуре предполагает очень агрессивную ценовую политику, использующую механизм, при котором все обращения к контекстному кэшу обрабатываются совершенно бесплатно , параллельно с ограниченной по времени парадигмой мгновенных продаж «пакетов токенов». Также существует типичный API с оплатой по мере использования для обращений, не связанных с кэшем, по стандартной цене 0,75/2,95 доллара США за миллион введенных/выведенных токенов.
Однако, благодаря ограниченной по времени рекламной скидке, эти операционные расходы резко сокращаются до 0,30 доллара за миллион токенов для некэшированных входных данных и 1,20 доллара за миллион токенов для выходных данных, что является одним из самых дешевых вариантов среди моделей с высокими показателями эффективности в мире.
|
Модель |
Входные данные ($/1 млн) |
Объем производства ($/1 млн) |
Итого ($/1 млн) |
Источник |
|
MiMo-V2.5 Flash |
0,10 доллара |
0,30 доллара |
0,40 доллара |
Xiaomi |
|
deepseek-v4-flash |
0,14 доллара |
0,28 доллара |
0,42 доллара |
DeepSeek |
|
deepseek-v4-pro |
0,435 доллара |
0,87 доллара |
1,305 доллара |
DeepSeek |
|
МиниМакс-М3 |
0,30 доллара |
1,20 доллара |
1,50 доллара |
МиниМакс |
|
LongCat-2.0 — акция, действующая ограниченное время. |
0,30 доллара |
1,20 доллара |
1,50 доллара |
ЛонгКэт |
|
Фонарик Gemini 3.1 |
0,25 доллара |
1,50 доллара |
1,75 доллара |
|
|
Qwen3.7-Plus |
0,40 доллара |
1,60 доллара |
2,00 доллара |
Alibaba Cloud |
|
MiMo-V2.5 |
0,40 доллара |
2,00 доллара |
2,40 доллара |
Xiaomi |
|
LongCat-2.0 — стандарт |
0,75 доллара |
2,95 доллара |
3,70 доллара |
ЛонгКэт |
|
Grok 4.3 (низкий контекст) |
1,25 доллара |
2,50 доллара |
3,75 доллара |
xAI |
|
MiMo-V2.5 Pro (≤256K) |
1,00 долл. |
3,00 доллара |
4,00 доллара |
Xiaomi |
|
Кими-К2.6 |
0,95 доллара |
4,00 доллара |
4,95 доллара |
Moonshot AI |
|
GLM-5.2 |
1,40 доллара |
4,40 доллара |
5,80 долларов |
З.ай |
|
GPT-5.6 Луна |
1,00 долл. |
6,00 долларов |
7,00 долларов |
OpenAI |
|
Grok 4.3 (высококонтекстный) |
2,50 доллара |
5,00 долларов |
7,50 долларов |
xAI |
|
MiMo-V2.5 Pro (>256K) |
2,00 доллара |
6,00 долларов |
8,00 долларов |
Xiaomi |
|
Qwen3.7-Max |
2,50 доллара |
7,50 долларов |
10,00 долларов |
Alibaba Cloud |
|
Вспышка Gemini 3.5 |
1,50 доллара |
9,00 долларов |
10,50 долларов |
|
|
Gemini 3.1 Pro Preview (≤200K) |
2,00 доллара |
12,00 долларов |
14,00 долларов |
|
|
GPT-5.6 Terra |
2,50 доллара |
15,00 долларов |
17,50 долларов |
OpenAI |
|
ГПТ-5.4 |
2,50 доллара |
15,00 долларов |
17,50 долларов |
OpenAI |
|
Gemini 3.1 Pro Preview (>200K) |
4,00 доллара |
18,00 долларов |
22,00 долларов |
|
|
Клод Опус 4.8 |
5,00 долларов |
25,00 долларов |
30,00 долларов |
Антропический |
|
ГПТ-5.5 |
5,00 долларов |
30,00 долларов |
35,00 долларов |
OpenAI |
|
GPT-5.5 Мгновенный чат (последние новости) |
5,00 долларов |
30,00 долларов |
35,00 долларов |
OpenAI |
|
Sakana Fugu Ultra (≤272K) |
5,00 долларов |
30,00 долларов |
35,00 долларов |
Сакана ИИ |
|
GPT-5.6 Sol |
5,00 долларов |
30,00 долларов |
35,00 долларов |
OpenAI |
|
Клод Басня 5 / Клод Мифос 5 |
10,00 долларов |
50,00 долларов |
60,00 долларов |
Антропический |
Что делает этот релиз переломным моментом для глобальной технологической инфраструктуры, так это его операционная независимость: масштабная модель была полностью обучена на кластере из более чем 50 000 отечественных китайских специализированных интегральных схем (ASIC), что доказывает возможность успешного масштабирования моделей ИИ, близких к передовым, без использования типичных американских графических процессоров Nvidia, которые до сих пор обеспечивали большую часть усилий по обучению передовых моделей генеративного ИИ в мире.
Успешное внедрение альтернативных кремниевых решений свидетельствует о глубоком структурном сдвиге. Если китайские конгломераты смогут последовательно создавать архитектуры с триллионами параметров, используя собственные ASIC-чипы вместо универсальных графических процессоров, это, по всей видимости, поставит под угрозу доминирование Nvidia в этом секторе.
Что особенно важно, этот технологический поворот происходит именно в тот момент, когда Вашингтон оказывает давление на ведущие американские лаборатории, требуя ограничить доступ к их новейшим моделям. По запросу правительства США компания OpenAI была вынуждена ограничить доступ к своим новым моделям GPT-5.6, а компания Anthropic ранее также получила от США предписание ограничить доступ к своим новейшим моделям Claude Fable 5 / Mythos 5, которые в ответ были полностью отключены. В то же время все больше технологов, активистов и экспертов отрасли предупреждают, что эти защитные регуляторные маневры непреднамеренно привели к обратному результату. Заблокировав западные модели с закрытым исходным кодом и повысив стоимость API, правительство США оставило широкое операционное окно для глобальных разработчиков, ищущих доступные высокопроизводительные альтернативы, подобные тем, что представлены в китайских моделях с открытым исходным кодом, таких как Meituan LongCat-2.0.
Операционные показатели подтвердили энтузиазм разработчиков: за время своего пребывания на платформе OpenRouter без указания бренда Owl Alpha ежемесячно выпускал приблизительно 10,1 триллиона токенов — в среднем 559 миллиардов токенов в день — что представляет собой взрывной рост объема на 242% по сравнению с предыдущим месяцем и позволило ему войти в тройку лидеров платформы в мире.
К тому моменту, когда компания Meituan заявила о своих правах на архитектуру, модель уже заняла первое место в рабочей области Hermes Agent, второе место в развертываниях Claude Code и третье место в международных средах OpenClaw.
Технология: Разработка разреженного контекста с 1 миллионом токенов.
В основе LongCat-2.0 лежит агрессивная оптимизация разреженности алгоритма Mixture-of-Experts (MoE), позволяющая увеличить общее количество параметров до 1,6 триллиона, одновременно ограничивая активные вычисления в среднем 48 миллиардами параметров на токен.
В зависимости от структурной сложности запроса, динамическая активация модели может включать от 33 до 56 миллиардов параметров. Данная конструкция реализует подход «экспертов с нулевым вычислительным ресурсом», гарантируя, что элементы выполнения рутинных операций проходят через более лёгкие подсети, полностью исключая накладные расходы на простаивание вычислительных ресурсов, которые обычно негативно сказываются на сверхплотных моделях.
Для обеспечения функциональности контекстного окна в 1 миллион токенов без катастрофических аппаратных узких мест компания Meituan представила алгоритм LongCat Sparse Attention (LSA). Разработанный как эволюционная версия алгоритма DeepSeek Sparse Attention, LSA решает проблему квадратичных затрат на оценку и фрагментации памяти, которые обычно характерны для мелкозернистых разреженных механизмов, с помощью трех различных, ортогональных векторов:
-
Индексирование с учетом потоковой передачи (SI): Эта система реструктурирует конвейер выбора токенов, сочетая аппаратно выровненные непрерывные операции чтения данных с динамическим случайным выбором. Преобразуя фрагментированный доступ к памяти в высокопредсказуемые последовательные блоки, система обеспечивает согласованное использование высокоскоростной памяти (HBM) и повышенную эффективную пропускную способность.
-
Индексирование между слоями (CLI): Используя эмпирический факт, что значимость внимания остается высокой в пределах смежных скрытых слоев, CLI амортизирует вычислительные затраты. Один проход индексирования успешно направляет несколько последовательных слоев во время вывода, что усиливается за счет межслойной дистилляции на протяжении всего этапа обучения.
-
Иерархическое индексирование (ИИ): Этот подход использует двухэтапную систему оценки от грубого к точному. Индексатор выполняет быструю, приблизительную проверку на уровне блоков для фильтрации кандидатов, прежде чем приступить к детальному отбору токенов исключительно из оставшейся совокупности.
Кроме того, Meituan интегрировала модуль N-граммового встраивания, унаследованный от более лёгких моделей. Расширяя распределение параметров в разреженных измерениях, полностью ортогональных к экспертной структуре MoE, архитектура добавляет 135 миллиардов параметров к структуре комбинирования токенов 5-грамм.
Это расширяет основное пространство встраивания примерно в 100 раз, позволяя модели улавливать плотные локальные взаимосвязи токенов и ускорять операции вывода больших пакетов за счет уменьшения узких мест в памяти, связанных с вводом/выводом (I/O).
Продукт: Постобучение, структура MOPD и эталонные показатели производительности.
В то время как универсальные модели обработки больших языков отдают приоритет гибким, разговорным интерфейсам, LongCat-2.0 фокусируется исключительно на многоэтапных инженерных задачах, интеграции инструментов и автоматизированном манипулировании репозиториями — другими словами, на задачах, выполняемых агентами.
В стандартизированных тестах LongCat-2.0 демонстрирует эмпирический результат 59,5 на SWE-bench Pro, превосходя показатель GPT-5.5 в 58,6. Модель также подтверждает свою специализацию на агентских функциях, показав результат 70,8 на Terminal-Bench 2.1, 77,3 на SWE-bench Multilingual и 73,2 на общем симуляторе корпоративных рабочих процессов FORTE.

Точное операционное поведение достигается за счет структурного слоя постобучения, называемого многоуровневой оптимизацией с помощью смеси специализированных экспертов (MOPD). Вместо того чтобы объединять необработанные отзывы людей в единую функцию вознаграждения, архитектура MOPD разделяет постобученную оптимизацию на три независимых, узкоспециализированных кластера экспертов.
-
Агенты-эксперты настроены исключительно на структурное выполнение, специализируясь на точном вызове инструментов, многоэтапном анализе параметров API и механизмах самокорректирующихся циклов для предотвращения стагнации выполнения.
-
Специалисты по логическому мышлению оптимизированы для решения задач, требующих изолированного подхода, таких как многошаговая логика, сложные инженерные схемы, математика и решение сложных задач в области STEM (наука, технология, инженерия и математика).
-
Специалисты по взаимодействию полностью сосредоточены на согласованности действий человека с системой, нюансах следования инструкциям, фактической основе для подавления галлюцинаций и поддержании жестких мер безопасности без снижения общей полезности модели.
Разделяя эти векторы на этапе постобучения, LongCat-2.0 предотвращает ухудшение функциональности. Затем динамический механизм маршрутизации шлюзов плавно объединяет эти специализированные функции во время выполнения, позволяя финальной модели одновременно координировать глубокое рассуждение, стабильное выполнение инструментов и безопасное взаимодействие с пользователем.
Хотя LongCat-2.0 в целом отстает от таких передовых систем, как Claude Opus 4.8, в широких тестах производительности универсальных агентов, таких как FORTE и BrowseComp, он явно превосходит ожидания в области разработки программного обеспечения.
Особенность этой открытой архитектуры заключается в ее гиперфокусе на автономной разработке; ей удается немного превзойти проприетарную архитектуру OpenAI GPT-5.5 в строгом тесте SWE-bench Pro для разработки программного обеспечения (59,5 против 58,6), доказывая свою высокую производительность и высокую конкурентоспособность в сложных задачах кодирования, несмотря на меньшую вычислительную нагрузку.
Коммерческая модель: оплата по факту использования против пакетов токенов, продаваемых в рамках экспресс-распродаж.
Стратегия развертывания Meituan предполагает внедрение специализированной коммерческой модели, которая разделяет доступ к сети между традиционной оплатой через API в режиме реального времени и структурированными «пакетами токенов».
Для традиционной интеграции корпоративных систем доступны стандартные счета пополнения, с которых операционный капитал списывается в режиме реального времени на основе введенных токенов и показателей их генерации.
Однако, чтобы справиться с непредсказуемыми всплесками вычислительных ресурсов, характерными для автономных агентов разработки, Meituan запустила структурированную систему пакетов токенов. Приобретаемые в виде фиксированных, разовых объемных выделений, действительных в течение строго 30-дневного периода, эти пакеты добавляются непосредственно к существующему базовому API-аккаунту организации.
Для управления сетевой нагрузкой на своих кластерах ASIC компания Meituan выпускает эти пакеты большого объема в рамках ограниченных по времени распродаж четыре раза в день, а именно в 10:00, 16:00, 21:00 и 23:00 по пекинскому времени, в порядке очереди. Экономическим преимуществом этой системы является бесплатная обработка попаданий в контекстный кэш.
В масштабных средах с большим количеством агентов, где помощнику по программированию приходится многократно читать, ссылаться и изменять один и тот же репозиторий кода, содержащий миллионы токенов, в течение длительной сессии, стандартные архитектуры наказывают разработчиков, взимая полную плату за многократное использование входного контекста.
В инфраструктуре Meituan квота на пакеты расходуется только на входные данные при промахах кэша и на окончательную генерацию токенов. Эта архитектура полностью меняет экономику операционных затрат при разработке крупномасштабного программного обеспечения для агентов, позволяя проводить глубокое итеративное исследование контекста без увеличения издержек.
Лицензирование: Структурная свобода с открытым исходным кодом
Зарегистрировав репозиторий LongCat-2.0 под открытой лицензией MIT, компания Meituan обеспечивает архитектуре максимальную юридическую гибкость для интеграции в корпоративную среду.
В отличие от парадигм копирования кода, таких как Универсальная общественная лицензия GNU (GPL), которая юридически обязывает разработчиков открывать исходный код любых производных фреймворков или внутреннего программного обеспечения, использующего этот код, лицензия MIT допускает практически неограниченную свободу.
Для корпоративных инженерных команд этот правовой стандарт гарантирует, что LongCat-2.0 может быть существенно модифицирован, скомпилирован и напрямую встроен в коммерческие приложения с закрытым исходным кодом, проприетарные инструменты разработки и внутренние системы автоматизации.
Корпорации могут создавать форки репозитория, оптимизировать внутренние механизмы LSA для частных баз данных и продавать полученный программный комплекс конечным пользователям без каких-либо обязательств по раскрытию своей интеллектуальной собственности или структурных улучшений.
Эволюция Meituan: от суперприложения для доставки до мощной компании в области искусственного интеллекта.
Компания Meituan, основанная в марте 2010 года серийным предпринимателем Ван Сином, первоначально запускалась как сайт ежедневных скидок в стиле Groupon, а затем быстро превратилась в одно из доминирующих «суперприложений» Китая.
После масштабного слияния с Dianping в 2015 году пекинский технологический гигант укрепил доминирующую долю рынка в городских коридорах доставки страны, объединив местные отзывы потребителей, мгновенную розничную торговлю, бронирование отелей и доставку еды. Компания Meituan, акции которой котируются на Гонконгской фондовой бирже, насчитывает более 770 миллионов пользователей в год и поддерживает сеть из более чем 14,5 миллионов продавцов.
Однако, столкнувшись с жесткой конкуренцией на внутреннем рынке, значительным снижением рентабельности и падением прибыли, компания агрессивно изменила свою стратегию, выйдя за рамки логистики. Meituan публично заявила о намерении инвестировать «миллиарды» в искусственный интеллект и развитие отечественных чиповых технологий для оживления своих технологически ориентированных предложений.
Этот стратегический сдвиг в глобальную гонку за искусственным интеллектом начал материализоваться в конце 2025 года с выпуском LongCat-Flash, базовой модели «смешанных экспертов» с 560 миллиардами параметров, за которой быстро последовала продвинутая модель логического мышления LongCat-Flash-Thinking. Опубликовав исходный код этих моделей передового класса под лицензиями, удобными для предприятий, Meituan продемонстрировала свое стремление стать основополагающим игроком в глобальной инфраструктуре ИИ, а не оставаться исключительно региональным гигантом электронной коммерции и доставки.
Влияние на предприятия: Автономные операционные рабочие процессы
Для современных предприятий выпуск LongCat-2.0 открывает четкие операционные стратегии в области разработки программного обеспечения, эксплуатации систем и интерпретации данных в длинных форматах.
Сочетание модели с открытым исходным кодом и лицензией MIT с обширным контекстным окном в 1 миллион токенов позволяет организациям обходить проблемы конфиденциальности данных и постоянные накладные расходы, связанные с размещением проприетарных сторонних API. В крупных корпоративных средах разработки команды могут использовать специализированных агентов-экспертов модели для организации автономной миграции кодовой базы.
Вместо того чтобы тратить сотни часов разработчиков на ручное переписывание устаревших фреймворков приложений, инженеры могут передать весь корпоративный репозиторий вместе с современной документацией SDK непосредственно в контекстное окно с миллионом токенов. LongCat-2.0 может сопоставлять зависимости, выполнять структурные обновления на уровне репозитория, компилировать новый код и автономно выявлять ошибки компиляции и выполнения в локальных средах песочницы, прежде чем генерировать окончательный запрос на слияние.
Архитектурное разделение модели посредством механизма маршрутизации MOPD обеспечивает значительные преимущества для строгого соблюдения корпоративных требований. Маршрутизируя конкретные операционные запросы через изолированные кластеры экспертов, финансовое учреждение или медицинская компания могут использовать сложные логические и математические вычисления, не рискуя получить ложные представления о фактах или нарушить строгие границы безопасности.
Эксперты по взаимодействию функционируют как неявный защитный слой, подавляя ошибки и обеспечивая соблюдение протоколов следования инструкциям без снижения вычислительной мощности внутренних экспертов по рассуждениям. В сочетании с моделью кэширования с нулевыми затратами предприятия могут поддерживать высокоточные автономные программные сети, способные многократно проверять корпоративные массивы данных, непрерывно поддерживая и оптимизируя внутреннюю инфраструктуру с минимальными эксплуатационными расходами.

Подпишитесь, чтобы получать самые свежие новости!
Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.
VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Все они
Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.
Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.
Источник: venturebeat.com
Похожие записи
Оцените материал:
Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
