Силуэт человека с телефоном на фоне логотипа Meta.

Лаборатория сверхинтеллекта Meta представила свою первую публичную модель, Muse Spark.

Компания Meta заявляет о высоких показателях производительности, но признает наличие «пробелов в производительности» в системах управления агентами и кодирования.

Изображение женщины, держащей мобильный телефон на фоне логотипа Meta, отображаемое на экране компьютера. Фигура стоит перед логотипом Meta, разработанным в то время, когда компания больше ориентировалась на виртуальную реальность, чем на искусственный интеллект. Фото: Getty Images | NurPhoto Фигура стоит перед логотипом Meta, разработанным в то время, когда компания больше ориентировалась на виртуальную реальность, чем на искусственный интеллект. Фото: Getty Images | NurPhoto Настройки текста Текст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков
Узнать больше Свернуть в навигацию

В среду компания Meta анонсировала Spark, первую модель искусственного интеллекта в семействе Muse, которая, по ее словам, представляет собой «полную перестройку наших усилий в области ИИ».

Muse Spark — это первый релиз лаборатории суперинтеллекта Meta, созданной чуть менее года назад с грандиозной целью «выполнить обещание о персональном суперинтеллекте для каждого». Этот релиз представляет собой полный разрыв с предыдущей работой Meta над семейством моделей Llama с открытым исходным кодом, которое получило посредственные отзывы как от пользователей, так и в независимых рейтингах LLM. И хотя Spark будет проприетарной моделью, основатель и генеральный директор Meta Марк Цукерберг заявил в сообщении на Threads, что семейство Muse в будущем будет «включать новые модели с открытым исходным кодом».

Мета заявила, что Muse Spark будет использовать контент, размещенный на таких платформах, как Instagram, Facebook и Threads, подобно тому, как Grok от xAI интегрирован с контентом, размещенным на X. В настоящее время это означает, что Muse Spark может ссылаться на общедоступные публикации, связанные с местоположением или актуальной темой, о которой вы спрашиваете, например. В будущем, по словам Меты, это расширится до «новых функций, которые будут ссылаться на рекомендации и контент, которым делятся люди», а также «Reels, фотографии и публикации, вплетенные непосредственно в ваши ответы с указанием авторства контента».

Созерцание и сжатие

2576da99d22711dce4766596e508ee8a Компания Meta утверждает, что режим созерцания в Muse Spark «обеспечивает превосходную производительность при сопоставимой задержке». Источник: Meta
Компания Meta утверждает, что режим созерцания в Muse Spark «обеспечивает превосходную производительность при сопоставимой задержке». Источник: Meta

В довольно технической статье в блоге, сопровождающей анонс Spark, Meta приводит уже ставший обычным список тестов производительности ИИ, в которых стандартный режим мышления Muse Spark показывает результаты, сопоставимые или превосходящие результаты конкурирующих моделей от OpenAI, Anthropic, Google и xAI. Но в этой статье также смущенно признается, что «мы продолжаем инвестировать в области с существующими пробелами в производительности, такие как агентные системы с долгосрочным горизонтом и рабочие процессы кодирования».

В том же сообщении Meta также рекламирует режим «Размышление», который, по их словам, будет «постепенно внедряться» и который может «управлять несколькими агентами, рассуждающими параллельно». Используя до 16 агентов, мыслящих согласованно одновременно, Meta утверждает, что режим «Размышление» «обеспечивает превосходную производительность при сопоставимой задержке». Эта «превосходная производительность» включает в себя, по данным Meta, рекордный показатель в 58,4 на последнем экзамене человечества (с использованием внешних инструментов).

Метаграф показывает, как дополнительное обучение приводит к «сжатию» использования токенов до того, как достигается дальнейшее повышение точности.

Хотя предыдущие модели Llama подвергались критике за то, что не использовали преимущества обучения с подкреплением, Meta утверждает, что Muse Spark демонстрирует «плавный и предсказуемый рост» после дополнительных шагов обучения с подкреплением после предварительного обучения, «повышая надежность модели без ущерба для разнообразия рассуждений». Эта система обучения с подкреплением также использует «штрафы за время обдумывания», которые, по словам Meta, уравновешивают необходимость «максимизировать правильность» с оптимизацией количества используемых токенов. В ходе тестирования на бенчмарке AIME 2025 Meta отмечает «фазовый переход», когда модель начала сжимать одинаково точные рассуждения в «значительно меньшее количество токенов». После этого сжатия последующие обученные модели постепенно снова увеличивали использование токенов, чтобы достичь еще более высокой точности за меньшее общее время, чем предыдущие несжатые версии.

Выпуск Muse Spark сопровождается обновлением расширенной системы масштабирования ИИ от Meta, которая, по словам компании, теперь охватывает более широкий спектр потенциальных рисков, связанных с ИИ. Компания заявляет, что модель «находится в пределах безопасных значений по всем категориям рисков, которые мы измеряли», но более подробная информация будет доступна только в предстоящем отчете о безопасности и готовности.

Muse Spark уже доступен в приложении Meta AI и на веб-сайте meta.ai, а также в виде закрытого API для предварительного просмотра для «избранных партнеров». Meta заявляет, что модель станет доступна через WhatsApp, Instagram, Facebook, Messenger и очки с искусственным интеллектом «в ближайшие недели».

Источник: arstechnica.com

✅ Найденные теги: Meta, Muse Spark, Лаборатория, Модель, новости, Сверхинтеллект

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Процессор AMD Ryzen 7 в упаковке на фоне геометрического узора.
Международная космическая станция на орбите Земли, вид из космоса.
PHP-код с изображением собаки и кошки на черном фоне.
Солнце над Землей с графиками, отражающими солнечную активность и влияние на атмосферу.
Флаг Франции на фоне синего неба, архитектурные детали здания, ясная солнечная погода.
Умные часы с прозрачным корпусом на руке человека, экран с красным интерфейсом.
Чертеж инженерной системы с деталями и таблицей ревизий.
Чертеж электрического соединителя с таблицей ревизий и блоком заголовка. Элементы уточняются.
Технология автономного кодирования увеличила выручку Mercyhealth на 5,1%.
Image Not Found
Процессор AMD Ryzen 7 в упаковке на фоне геометрического узора.

Лучший игровой процессор Ryzen 7 9800X3D подешевел до $410

Запуск AMD Ryzen 7 9850X3D не увенчался особым успехом — несмотря на приличное повышение тактовой частоты на бумаге, на деле его производительность едва можно отличить от Ryzen 7 9800X3D, что подтверждается многочисленными тестами, в том числе нашими,…

Апр 12, 2026
Флаг Франции на фоне синего неба, архитектурные детали здания, ясная солнечная погода.

Франция откажется от Windows в пользу Linux, чтобы уменьшить зависимость от американских технологий.

Источник изображения: AMAURY CORNU/Hans Lucas/AFP / Getty Images Франция пытается отказаться от Microsoft Windows. Страна заявила о планах перевести часть своих государственных компьютеров, работающих под управлением Windows, на операционную систему с открытым исходным кодом Linux, чтобы еще…

Апр 12, 2026
Умные часы с прозрачным корпусом на руке человека, экран с красным интерфейсом.

От космоса к коду: «умные» часы по мотивам миссии Artemis II

На фоне возросшего интереса к космическим миссиям, особенно после запуска Artemis II mission, компания CircuitMess представила смарт-часы Artemis Watch 2.0 — устройство, вдохновлённое возвращением человека на Луну.  Внутри находится двухъядерный микроконтроллер ESP32, цветной дисплей, а также набор…

Апр 12, 2026
Чертеж электрического соединителя с таблицей ревизий и блоком заголовка. Элементы уточняются.

От 4 недель до 45 минут: разработка системы извлечения данных из более чем 4700 PDF-файлов.

Как гибридный конвейер обработки изображений PyMuPDF + GPT-4 Vision позволил сократить трудозатраты на ручную разработку на 8000 фунтов стерлингов, и почему новейшие модели оказались неподходящим решением. Делиться Изображение создано автором. В мой кабинет зашёл человек и спросил,…

Апр 12, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых