Одна модель вместо трёх: LongCat-Next объединяет текст, звук и визуал…
Одна модель вместо трёх: LongCat-Next объединяет текст, звук и визуал
Появился LongCat-Next — мультимодальная модель, которая работает сразу с несколькими типами данных в одной задаче.
Не «склеивает» результаты, а обрабатывает всё внутри одной системы.
Что внутри:
— архитектура MoE
— 74B параметров, но активны только 3B
— поддержка текста, изображений и аудио одновременно
Что умеет:
— генерировать визуальный контент
— понимать речь
— вести голосовые диалоги
— клонировать голос
То есть это не набор отдельных моделей, а единая система для разных модальностей.
Главный плюс — эффективность.
MoE позволяет держать большую модель, но включать только нужную часть под задачу.
Похожие записи
Оцените материал:
Похожие записи
Новая вакцина от рака на наночастицах Она показала впечатляющие результаты:…
20.10.2025
NotebookLM — ваш персональный ИИ-исследователь NotebookLM на основе Gemini 2.0…
09.09.2025
Отличная новость! С 15 Июня Антропики будут отгружать дополнительные кредиты…
09.06.2026Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
