Одна модель вместо трёх: LongCat-Next объединяет текст, звук и визуал…
Одна модель вместо трёх: LongCat-Next объединяет текст, звук и визуал
Появился LongCat-Next — мультимодальная модель, которая работает сразу с несколькими типами данных в одной задаче.
Не «склеивает» результаты, а обрабатывает всё внутри одной системы.
Что внутри:
— архитектура MoE
— 74B параметров, но активны только 3B
— поддержка текста, изображений и аудио одновременно
Что умеет:
— генерировать визуальный контент
— понимать речь
— вести голосовые диалоги
— клонировать голос
То есть это не набор отдельных моделей, а единая система для разных модальностей.
Главный плюс — эффективность.
MoE позволяет держать большую модель, но включать только нужную часть под задачу.
Похожие записи
Оцените материал:
Похожие записи
Полезные сочетания клавиш в Windows 11 ➡️ В Windows 11…
18.06.2025
Microsoft внезапно выпустили нового короля генерации 3D-моделей — Trellis 2…
11.01.2026
Запускаем стартап без команды — NocoBase дает вам собственный ИИ-отдел…
24.11.2025Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
