Компания Meta заявляет о высоких показателях производительности, но признает наличие «пробелов в производительности» в системах управления агентами и кодирования.
Фигура стоит перед логотипом Meta, разработанным в то время, когда компания больше ориентировалась на виртуальную реальность, чем на искусственный интеллект. Фото: Getty Images | NurPhoto Фигура стоит перед логотипом Meta, разработанным в то время, когда компания больше ориентировалась на виртуальную реальность, чем на искусственный интеллект. Фото: Getty Images | NurPhoto Настройки текстаТекст рассказа Размер Маленький Стандартный Большой Ширина * Стандартный Широкий Ссылки Стандартный Оранжевый * Только для подписчиков
Узнать больше Свернуть в навигацию
В среду компания Meta анонсировала Spark, первую модель искусственного интеллекта в семействе Muse, которая, по ее словам, представляет собой «полную перестройку наших усилий в области ИИ».
Muse Spark — это первый релиз лаборатории суперинтеллекта Meta, созданной чуть менее года назад с грандиозной целью «выполнить обещание о персональном суперинтеллекте для каждого». Этот релиз представляет собой полный разрыв с предыдущей работой Meta над семейством моделей Llama с открытым исходным кодом, которое получило посредственные отзывы как от пользователей, так и в независимых рейтингах LLM. И хотя Spark будет проприетарной моделью, основатель и генеральный директор Meta Марк Цукерберг заявил в сообщении на Threads, что семейство Muse в будущем будет «включать новые модели с открытым исходным кодом».
Мета заявила, что Muse Spark будет использовать контент, размещенный на таких платформах, как Instagram, Facebook и Threads, подобно тому, как Grok от xAI интегрирован с контентом, размещенным на X. В настоящее время это означает, что Muse Spark может ссылаться на общедоступные публикации, связанные с местоположением или актуальной темой, о которой вы спрашиваете, например. В будущем, по словам Меты, это расширится до «новых функций, которые будут ссылаться на рекомендации и контент, которым делятся люди», а также «Reels, фотографии и публикации, вплетенные непосредственно в ваши ответы с указанием авторства контента».
Созерцание и сжатие
Компания Meta утверждает, что режим созерцания в Muse Spark «обеспечивает превосходную производительность при сопоставимой задержке». Источник: MetaВ довольно технической статье в блоге, сопровождающей анонс Spark, Meta приводит уже ставший обычным список тестов производительности ИИ, в которых стандартный режим мышления Muse Spark показывает результаты, сопоставимые или превосходящие результаты конкурирующих моделей от OpenAI, Anthropic, Google и xAI. Но в этой статье также смущенно признается, что «мы продолжаем инвестировать в области с существующими пробелами в производительности, такие как агентные системы с долгосрочным горизонтом и рабочие процессы кодирования».
В том же сообщении Meta также рекламирует режим «Размышление», который, по их словам, будет «постепенно внедряться» и который может «управлять несколькими агентами, рассуждающими параллельно». Используя до 16 агентов, мыслящих согласованно одновременно, Meta утверждает, что режим «Размышление» «обеспечивает превосходную производительность при сопоставимой задержке». Эта «превосходная производительность» включает в себя, по данным Meta, рекордный показатель в 58,4 на последнем экзамене человечества (с использованием внешних инструментов).
Хотя предыдущие модели Llama подвергались критике за то, что не использовали преимущества обучения с подкреплением, Meta утверждает, что Muse Spark демонстрирует «плавный и предсказуемый рост» после дополнительных шагов обучения с подкреплением после предварительного обучения, «повышая надежность модели без ущерба для разнообразия рассуждений». Эта система обучения с подкреплением также использует «штрафы за время обдумывания», которые, по словам Meta, уравновешивают необходимость «максимизировать правильность» с оптимизацией количества используемых токенов. В ходе тестирования на бенчмарке AIME 2025 Meta отмечает «фазовый переход», когда модель начала сжимать одинаково точные рассуждения в «значительно меньшее количество токенов». После этого сжатия последующие обученные модели постепенно снова увеличивали использование токенов, чтобы достичь еще более высокой точности за меньшее общее время, чем предыдущие несжатые версии.
Выпуск Muse Spark сопровождается обновлением расширенной системы масштабирования ИИ от Meta, которая, по словам компании, теперь охватывает более широкий спектр потенциальных рисков, связанных с ИИ. Компания заявляет, что модель «находится в пределах безопасных значений по всем категориям рисков, которые мы измеряли», но более подробная информация будет доступна только в предстоящем отчете о безопасности и готовности.
Muse Spark уже доступен в приложении Meta AI и на веб-сайте meta.ai, а также в виде закрытого API для предварительного просмотра для «избранных партнеров». Meta заявляет, что модель станет доступна через WhatsApp, Instagram, Facebook, Messenger и очки с искусственным интеллектом «в ближайшие недели».
Источник: arstechnica.com
























