Image

Прощай, Лама? Компания Meta запускает новую собственную модель искусственного интеллекта Muse Spark — первую с момента основания Superintelligence Labs.

Карл Франзен

Лама выходит из Meta с коробкой под вывеской Muse Spark.

Лама выходит из Meta с коробкой под вывеской Muse Spark. Источник: VentureBeat, создано с помощью OpenAI GPT-Image-1.5

Компания Meta была одной из самых интересных в эпоху генеративного ИИ — первоначально она завоевала огромную лояльную аудиторию пользователей благодаря выпуску своего семейства больших языковых моделей (LLM) Llama, в основном с открытым исходным кодом, в начале 2023 года, но резко остановила свою деятельность в прошлом году после того, как Llama 4 дебютировала с неоднозначными отзывами и, в конечном итоге, с признанием в игровых бенчмарках.

По всей видимости, не совсем удачный запуск Llama 4 подтолкнул основателя и генерального директора Meta Марка Цукерберга к полной реорганизации операций Meta в области искусственного интеллекта летом 2025 года. В рамках этой реорганизации было создано новое внутреннее подразделение Meta Superintelligence Labs (MSL), на должность директора по искусственному интеллекту которого он пригласил 29-летнего Александра Вана, бывшего соучредителя и генерального директора Scale AI.

Сегодня Meta демонстрирует результаты этих усилий: Muse Spark, новая запатентованная модель, которая, по словам Вана (опубликованного в конкурирующей социальной сети X, более часто используемой сообществом машинного обучения), является «самой мощной моделью, выпущенной Meta», и имеет «поддержку для использования инструментов, визуальной цепочки мыслей и многоагентной оркестровки». Он также говорит, что это станет началом нового семейства моделей Muse, что поднимает вопросы о том, что станет с популярной линейкой моделей Meta и продолжающимся развитием семейства Llama.

Он появляется не как обычный чат-бот, а как основа для того, что Ван называет «персональным сверхинтеллектом» — ИИ, который не просто обрабатывает текст, но и «видит и понимает окружающий мир», выступая в качестве цифрового продолжения самого себя, что перекликается с публичным манифестом Цукерберга о видении персонального сверхинтеллекта, опубликованным летом 2025 года.

Однако, согласно сообщению в блоге Meta, эта функция является исключительно частной — пока она доступна только в приложении и на веб-сайте Meta AI, а также в рамках «предварительного просмотра частного API для избранных пользователей». Этот шаг, вероятно, вызовет недовольство у миллиардов пользователей моделей Llama и тысяч разработчиков, которые на них полагались (некоторые из которых являются активными участниками сабреддита r/LocalLLaMA в конкурирующей социальной сети Reddit). Кроме того, информация о ценах на эту модель пока не объявлена.

Неясно, прекратила ли компания Meta разработку семейства Llama полностью. На прямой вопрос VentureBeat представитель Meta ответил по электронной почте: «Наши текущие модели Llama будут по-прежнему доступны в качестве открытого исходного кода», что не отвечает на вопрос о разработке будущих моделей Llama.

Визуальная цепочка мыслей

По своей сути, Muse Spark — это изначально мультимодальная модель рассуждений. В отличие от предыдущих версий, которые «сшивали» изображение и текст вместе, Muse Spark была перестроена с нуля, чтобы интегрировать визуальную информацию во внутреннюю логику. Этот архитектурный сдвиг обеспечивает «визуальную цепочку мыслей», позволяя модели аннотировать динамические среды — идентифицировать компоненты сложной кофемашины или корректировать технику выполнения упражнений йоги пользователем с помощью анализа видеоряда.

Однако наиболее значительным техническим прорывом является новый режим «Размышление». Эта функция позволяет нескольким суб-агентам рассуждать параллельно, что дает Meta возможность конкурировать с моделями экстремального рассуждения, такими как Gemini Deep Think от Google и GPT-5.4 Pro от OpenAI.

В ходе сравнительных тестов этот режим показал 58% в «Последнем экзамене человечества» и 38% в «Исследованиях на передовом рубеже науки», что, по утверждению Meta, подтверждает их новую траекторию масштабирования.

Возможно, еще более впечатляющим для финансовых результатов компании является эффективность модели. По данным Meta, Muse Spark достигает своих возможностей по рассуждению, используя более чем на порядок меньше вычислительных ресурсов, чем Llama 4 Maverick, ее предыдущий флагманский продукт среднего размера. Эта эффективность обусловлена процессом, называемым «сжатием мышления». В процессе обучения с подкреплением модель наказывается за чрезмерное «время на обдумывание», заставляя ее решать сложные задачи с меньшим количеством логических элементов без ущерба для точности.

Результаты контрольных показателей свидетельствуют о возвращении к прежней форме.

Запуск Muse Spark преподносится как статистический «квантовый скачок», положивший конец годичному отсутствию Meta на самом переднем крае производительности ИИ.

Диаграмма результатов теста MetaMuse Spark.

Диаграмма результатов теста MetaMuse Spark. Источник: Meta.

Сопоставив официальные внутренние данные Meta с независимым аудитом, проведенным сторонней компанией Artificial Analysis, занимающейся отслеживанием LLM-моделей, вырисовывается четкая картина: Muse Spark — это не просто незначительное улучшение по сравнению с серией Llama; это фундаментальное возвращение в «Топ-5» глобальных моделей.

График индекса искусственного интеллекта, созданный с помощью MetaMuseSpark.

График индекса интеллекта искусственного анализа, созданный с помощью MetaMuseSpark. Источник: Artificial Analysis/X

Согласно индексу искусственного интеллекта версии 4.0, Muse Spark набрал 52 балла . Для сравнения, предыдущий флагман Meta, Llama 4 Maverick , дебютировал в 2025 году с индексом всего 18.

Благодаря почти утроенной производительности, M use Spark теперь находится в непосредственной близости от самых элитных систем отрасли, уступая лишь Gemini 3.1 Pro Preview (57), GPT-5.4 (57) и Claude Opus 4.6 (53).

Официальные тесты Meta показывают, что Muse Spark особенно доминирует в многомодальном мышлении, в частности, там, где визуальные образы и логика пересекаются.

  • Анализ CharXiv : В категории «понимание изображений» Muse Spark показал результат 86,4 , значительно превзойдя Claude Opus 4.6 (65,3), Gemini 3.1 Pro (80,2) и GPT-5.4 (82,8).

  • MMMU Pro : Официальные отчеты оценивают модель на 80,4% , в то время как независимый аудит Artificial Analysis показал 80,5% . Это делает ее второй по производительности моделью системы машинного зрения на рынке, уступая только Gemini 3.1 Pro Preview (83,9% по официальным данным; 82,4% по независимым).

  • Визуальная точность (SimpleVQA) : Muse Spark набрал 71,3 балла, опередив GPT-5.4 (61,1) и Grok 4.2 (57,4), хотя и немного уступив Gemini 3.1 Pro (72,4).

Эти результаты подтверждают, что Meta фокусируется на «визуальной цепочке мыслей», что позволяет модели не только распознавать объекты, но и рассуждать над сложными пространственными задачами и динамическими аннотациями.

«Мыслящий» функционал Muse Spark был протестирован с помощью специализированных тестов, разработанных для проверки моделей, не основанных на логическом мышлении.

  • Последний экзамен человечества (HLE) : В этой междисциплинарной оценке Meta показывает результат 42,8 (без инструментов) и 50,4 (с инструментами). Независимые аудиты, проведенные компанией Artificial Analysis, оценили модель на 39,9% , уступив Gemini 3.1 Pro Preview (44,7%) и GPT-5.4 (41,6%).

  • GPQA Diamond (PhD Level Reasoning) : Muse Spark достиг впечатляющего результата в 89,5 баллов , превзойдя Grok 4.2 (88,5), но уступив специализированным результатам «максимального рассуждения» Opus 4.6 (92,7) и Gemini 3.1 Pro (94,3).

  • ARC AGI 2 : Это по-прежнему заметное слабое место. Muse Spark набрал 42,5 балла , что значительно меньше, чем результаты решения задач на абстрактное мышление, достигнутые Gemini 3.1 Pro (76,5) и GPT-5.4 (76,1).

  • CritPT (Physics Research) : Независимый аудит показал, что Muse Spark занял 5-е место с результатом 11% . Это значительное преимущество перед Gemini 3 Flash (9%) и Claude 4.6 Sonnet (3%).

Одним из наиболее впечатляющих результатов официальных данных является показатель эффективности Muse Spark в секторе здравоохранения, что, вероятно, является следствием сотрудничества Meta с более чем 1000 врачами.

  • В тесте HealthBench Hard Muse Spark показал результат 42,8 , что значительно превосходит показатели Claude Opus 4,6 (14,8), Gemini 3,1 Pro (20,6) и даже GPT-5,4 (40,1).

  • MedXpertQA (мультимодальный тест) : результат составил 78,4 , что значительно выше показателей Opus 4.6 (64,8) и Grok 4.2 (65,8), хотя он всё ещё уступает лучшему результату Gemini 3.1 Pro — 81,3.

Агентные системы и эффективность: эффект «сжатия мысли»

Хотя Muse Spark превосходно справляется с логическим мышлением, его «агентная» модель работы — выполнение реальных рабочих задач — демонстрирует более тонкую картину.

  • SWE-Bench Verified : Muse Spark набрал 77,4 балла , уступив Claude Opus 4.6 (80,8) и Gemini 3.1 Pro (80,6).

  • Официальная оценка GDPval-AA Elo : Meta в 1444 балла немного отличается от оценки Artificial Analysis в 1427 баллов . В обоих случаях Muse Spark отстает от GPT-5.4 (1672) и Opus 4.6 (1606), что говорит о том, что, хотя модель хорошо «думает», она все еще совершенствует свою способность «действовать» в долгосрочных программных и офисных рабочих процессах.

  • Эффективность использования токенов : Именно здесь Muse Spark выделяется среди конкурентов. Для запуска Индекса Интеллекта было использовано 58 миллионов выходных токенов . Для сравнения, Claude Opus 4.6 потребовалось 157 миллионов токенов, а GPT-5.4120 миллионов . Это подтверждает утверждение Meta о « сжатии мыслей » — предоставлении интеллекта передового уровня при использовании менее половины «времени на обдумывание» по сравнению с ближайшими конкурентами.

Бенчмарк

Лама 4 Маверик (2025)

Muse Spark (Official)

Gemini 3.1 Pro (официальная версия)

Индекс интеллекта

18

52

57

MMMU Pro

80.4

83.9

Рассуждения CharXiv

86.4

80.2

HealthBench Hard

42.8

20.6

Лицензия

Открытая весовая категория

Собственная разработка

Собственная разработка

Благодаря Muse Spark, Meta успешно перешла от статуса «LAMP-стека для ИИ» к прямому претенденту на звание «Персонального сверхинтеллекта». Хотя рабочие процессы с участием агентов по-прежнему остаются препятствием, ее доминирование в области зрения, здоровья и эффективности использования токенов возвращает Meta в центр гонки за лидерство.

Личное благополучие и шопинг в Instagram

Компания Meta незамедлительно внедряет Muse Spark для обеспечения работы специализированных функций во всей линейке своих приложений.

  • Режим покупок: новая функция, использующая обширную экосистему создателей контента Meta. Искусственный интеллект распознает бренды, предпочтения в стиле и контент в Instagram и Threads, чтобы предоставлять персонализированные рекомендации, фактически превращая каждый пост в интерактивную возможность для покупки.

  • Обоснование с точки зрения здоровья: Стремясь к практическому применению в медицине, компания Meta сотрудничала с более чем 1000 врачами для сбора обучающих данных. Теперь Muse Spark может анализировать пищевую ценность фотографий продуктов питания или предоставлять «оценки здоровья» для пескетарианских диет с высоким содержанием холестерина.

  • Интерактивный пользовательский интерфейс: модель может генерировать веб-мини-игры или обучающие материалы на лету. Например, пользователь может попросить ИИ превратить фотографию в играбельную игру судоку или в пошаговое руководство по эксплуатации бытовой техники.

осведомленность об оценке

Несмотря на то, что Muse Spark демонстрирует явное нежелание применять биологическое и химическое оружие, в его профиле безопасности содержится поразительное новое открытие. Независимые испытания, проведенные компанией Apollo Research, показали, что модель обладает высокой степенью «осведомленности об оценке».

Модель часто распознавала, когда во время тестирования возникали «ловушки выравнивания», и делала вывод, что должна вести себя честно именно потому, что находилась на стадии оценки.

Хотя компания Meta пришла к выводу, что это не является «препятствием» для выпуска, полученные данные свидетельствуют о том, что перспективные модели становятся все более «внимательными» к условиям тестирования, что потенциально может снизить надежность традиционных критериев безопасности, поскольку модели учатся «обходить» экзамен.

Что случится с Ламой?

В феврале 2023 года Meta выпустила Llama 1, чтобы продемонстрировать, что более мелкие, оптимизированные для вычислений модели могут по эффективности сравниться с более крупными аналогами, такими как GPT-3. Хотя первоначально доступ был ограничен для исследователей, веса модели были опубликованы на 4chan 3 марта 2023 года, что непреднамеренно демократизировало высокоуровневые исследования и послужило толчком для глобального движения за запуск моделей на потребительском оборудовании.

Этот сдвиг закрепился в июле 2023 года с выпуском Llama 2, которая представила коммерческую лицензию, позволяющую большинству организаций размещать приложение самостоятельно. Такой подход быстро получил распространение: к третьему кварталу 2023 года семейство Llama превысило 100 миллионов загрузок и поддерживало более 1000 коммерческих приложений.

В течение 2024 и 2025 годов компания Meta масштабировала семейство Llama, превратив его в важнейшую инфраструктуру для глобального корпоративного ИИ, часто называемую стеком LAMP для ИИ. После запуска Llama 3 в апреле 2024 года и знакового Llama 3.1 405B в июле, Meta достигла паритета производительности с ведущими мировыми проприетарными системами.

В апреле 2025 года вышел Llama 4, в котором была представлена архитектура «смешанных экспертов», позволяющая масштабировать параметры, сохраняя при этом высокую скорость вывода. К началу 2026 года экосистема Llama достигла ошеломляющих масштабов, насчитывая 1,2 миллиарда загрузок и в среднем около миллиона загрузок в день.

Широкое распространение этой технологии обеспечило предприятиям значительную экономическую независимость, поскольку модели Llama с самостоятельным размещением сервиса позволили снизить затраты на 88% по сравнению с использованием проприетарных API-провайдеров.

По состоянию на апрель 2026 года роль Meta как бесспорного лидера движения в открытой весовой категории трансформировалась в условиях жесткой конкуренции на многополярном рынке, характеризующемся ростом числа международных конкурентов.

Хотя на Соединенные Штаты приходится 35% всех развертываний Llama в мире, китайские модели от таких лабораторий, как Alibaba и DeepSeek, к концу 2025 года стали занимать 41% загрузок на платформах типа Hugging Face. В начале 2026 года новые игроки, такие как GLM-5 от Zhipu AI и Qwen 3.6 Plus от Alibaba, превзошли Llama 4 Maverick по результатам тестов на общие знания и навыки программирования.

В ответ на это глобальное давление, Muse Spark от Meta выходит с высокими ожиданиями и с наследием открытого исходного кода, которому будет непросто соответствовать.

Конфиденциальная информация (пока что).

Запуск Muse Spark знаменует собой спорный отход от корней Meta AI, основанных на концепции «открытой науки». В то время как серия Llama была известна своей доступностью для разработчиков, Muse Spark запускается по проприетарной модели.

Ван прокомментировал изменения в X, заявив: «Девять месяцев назад мы полностью перестроили нашу систему искусственного интеллекта. Новая инфраструктура, новая архитектура, новые конвейеры обработки данных… Это первый шаг. Более крупные модели уже находятся в разработке, и планируется открыть исходный код будущих версий».

Однако сообщество разработчиков по-прежнему настроено скептически. Некоторые видят в этом необходимую перемену после того, как серия Llama 4 не смогла завоевать ожидаемый интерес разработчиков; другие же считают, что Meta «закрывает двери», поскольку теперь у нее есть конкурентная модель мышления.

Сам Ван признал сложность переходного периода, отметив, что «безусловно, есть шероховатости, которые мы со временем сгладим».

Для 3 миллиардов пользователей приложений Meta изменения будут ощутимы практически мгновенно. Искусственный интеллект, с которым они взаимодействуют, больше не является просто библиотекой информации, а превращается в агента с интеллектом стоимостью 27 миллиардов долларов и задачей понимать окружающий мир так же глубоко, как и они сами.

Подпишитесь, чтобы получать самые свежие новости!

Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.

VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Мероприятия VB Все они

Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.

Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.

Источник: venturebeat.com

✅ Найденные теги: Meta, Muse Spark, Superintelligence Labs, искусственный интеллект, Лама, новости, Прощай,

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Золотое украшение с профилем мужчины, поврежденное с одной стороны, на чёрном фоне.
Профиль Сатоши Накамото: криптовалютный портфель и стоимость активов.
Робот рисует картину на холсте кистью в художественной студии.
Спасательная операция капсулы в океане с лодками и людьми, надувные буи.
Спасательная операция на море: команда эвакуирует капсулу космического корабля из воды.
Компактные мини-ПК MSI черного и белого цветов с USB-портами на передней панели.
Поверхность с кратером, покрытая песком и камнями, освещена солнечным светом.
Абстрактное изображение частиц, протекающих из центра, синие и разноцветные линии.
Летающая тарелка в ночном лесу, освещающая деревья голубым светом.
Image Not Found
Золотое украшение с профилем мужчины, поврежденное с одной стороны, на чёрном фоне.

В Англии нашли переделанную в подвеску необычную золотую монету. На артефакте IX века изображен Иоанн Креститель

На артефакте IX века изображен Иоанн Креститель Любитель поиска древностей и старинных артефактов с помощью металлоискателя обнаружил в графстве Норфолк, которое находится на востоке Англии, крайне необычную подвеску. Она представляет собой большой фрагмент золотой монеты, имитирующей римский или византийский солид, с проделанным отверстием, за которое…

Апр 10, 2026
Профиль Сатоши Накамото: криптовалютный портфель и стоимость активов.

NYT утверждает, что раскрыла личность создателя биткоина

NYT утверждает, что раскрыла личность создателя биткоина. Под ником Сатоши Накамото якобы скрывается 55-летний британский криптограф Адам Бэк Вывод журналистов газеты основывается на анализе тысяч сообщений из архивной переписки группы киберпанков в 1990-х, с которой были связаны…

Апр 10, 2026
Компактные мини-ПК MSI черного и белого цветов с USB-портами на передней панели.

MSI запустила серию мини-ПК Cubi NUC TWG с процессорами Intel N150 и N250

Если Thermalright предпочитает демонстрировать мини-ПК с AMD Ryzen AI MAX+ 395 и системой жидкостного охлаждения, то MSI готова порадовать любителей значительно более дешёвого, компактного и менее производительного, но всё ещё достаточного для офисной работы. Для этого она…

Апр 10, 2026
Луна видна через иллюминатор космического корабля, окруженного проводами и оборудованием.

Как при проектировании космического корабля «Артемида II» учитывался (относительный) комфорт.

Как при проектировании космического корабля Artemis II учитывался (относительный) комфорт. Фрилансер Публикации этого автора будут добавляться в вашу ежедневную рассылку по электронной почте и в ленту новостей на главной странице вашего сайта. Все работы Джорджины Торбет (6…

Апр 10, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых