Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base

07903b15a10f8bdd871656fd4af1b6f4

Модель хороша тем, что даёт почти уровень больших LLM на длинных контекстах, но при этом заметно экономит память и работает быстрее за счёт линейной архитектуры.

Что улучшили:

— требует до 75% меньше памяти на KV-кэш

— до 6.3? быстрее декодирование на длинных контекстах

Как устроена:

— гибридный подход: Kimi Delta Attention + MLA

— модель хорошо оптимизирована под длиннный контекст и высокую пропускную способность

По бенчмаркам модель обгоняет и MLA, и GDN-H, включая задачи с длинным контекстом. В задачах на рассуждения и длинную RL-генерацию Kimi-Linear показывает заметно лучшие результаты, чем MLA.

Архитектура модели пример того, как линейные attention-архитектуры выходят на уровень, где они конкурируют с классическими решениями не только по скорости, но и по качеству.

Github: github.com/MoonshotAI/Kimi-Linear

Hf: https://huggingface.co/moonshotai/Kimi-Linear-48B-A3B-Instruct

Источник: huggingface.co

Источник: ai-news.ru

✅ Найденные теги: Kimi, новости

Нет других записей в этой рубрике.

Новости других рубрик

Архив рубрики ~Лента новостей~: Пассивная агрессия Архив рубрики ~Лента новостей~: Система охлаждения для видеокарт AMD следующего поколения показана ASRock на COMPUTEX 2026 Архив рубрики ~Лента новостей~: Show HN: Lowfat – подключаемый CLI-фильтр, который сэкономил 91,8% моих токенов LLM. Архив рубрики ~Лента новостей~: Рид Хоффман покидает совет директоров Microsoft, чтобы перейти в «режим основателя» и запустить стартап Manus. Архив рубрики ~Лента новостей~: Самосовершенствующийся ИИ: что происходит внутри Anthropic Архив рубрики ~Лента новостей~: Что означают новые правила британского надзорного органа в отношении результатов поиска Google с использованием искусственного интеллекта для издателей? Архив рубрики ~Лента новостей~: Футуролог Microsoft в области искусственного интеллекта рассказывает о том, как он использует Copilot, и о реальных проблемах, которые предприятия решают с помощью агентов. Архив рубрики ~Лента новостей~: Мадонёнок с огонёнком. Как Чуковский конструирует детскую речь