Image

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base

07903b15a10f8bdd871656fd4af1b6f4

Модель хороша тем, что даёт почти уровень больших LLM на длинных контекстах, но при этом заметно экономит память и работает быстрее за счёт линейной архитектуры.

Что улучшили:

— требует до 75% меньше памяти на KV-кэш

— до 6.3? быстрее декодирование на длинных контекстах

Как устроена:

— гибридный подход: Kimi Delta Attention + MLA

— модель хорошо оптимизирована под длиннный контекст и высокую пропускную способность

По бенчмаркам модель обгоняет и MLA, и GDN-H, включая задачи с длинным контекстом. В задачах на рассуждения и длинную RL-генерацию Kimi-Linear показывает заметно лучшие результаты, чем MLA.

Архитектура модели пример того, как линейные attention-архитектуры выходят на уровень, где они конкурируют с классическими решениями не только по скорости, но и по качеству.

Github: github.com/MoonshotAI/Kimi-Linear

Hf: https://huggingface.co/moonshotai/Kimi-Linear-48B-A3B-Instruct

Источник: huggingface.co

Источник: ai-news.ru

✅ Найденные теги: Kimi, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Смартфон с открытым сайтом Medicare.gov на экране, онлайн-сервис здравоохранения.
ideipro logotyp
Ноутбук с программой редактирования изображений, яркое фото человека в синем плаще.
Человек в кожаной куртке демонстрирует процессор на футуристическом фоне.
ideipro logotyp
Отражение деревьев в воде озера, спокойная гладь.
ideipro logotyp
Цифровой компонент на фоне блокчейн-технологии и сетевых данных.
Пирамида факторов риска, симптомов и локаций для тропических заболеваний.
Image Not Found
Смартфон с открытым сайтом Medicare.gov на экране, онлайн-сервис здравоохранения.

STAT+: Достаточно ли платит программа Medicare ACCESS?

Вы читаете веб-версию издания STAT о технологиях в здравоохранении. Управление оповещениями для этой статьи Отправить эту статью по электронной почте Поделитесь этой статьей Adobe Вы читаете веб-версию информационного бюллетеня STAT о технологиях в здравоохранении — нашего руководства…

Мар 5, 2026
ideipro logotyp

Нейродегенеративные заболевания нуждаются в большем количестве клинических исследований, основанных на изучении механизмов их развития.

Недавние неудачи в громких клинических испытаниях нейродегенеративных заболеваний подчеркивают необходимость переосмысления соотношения клинических амбиций и биологического понимания. Компания Novo Nordisk недавно объявила, что пероральный препарат семаглутид, агонист рецептора GLP-1, не смог замедлить прогрессирование болезни Альцгеймера в двух…

Мар 5, 2026
Ноутбук с программой редактирования изображений, яркое фото человека в синем плаще.

Apple представила MacBook Pro M5 Pro и Max, а также свои первые новые мониторы за последние годы.

Новые ноутбуки отличаются большим объемом памяти, но и более высокой начальной ценой. Эндрю Каннингем – | 170 Компания Apple представляет новые MacBook Pro с процессорами M5 Pro и M5 Max. Фото: Apple. Компания Apple представляет новые MacBook…

Мар 5, 2026
Человек в кожаной куртке демонстрирует процессор на футуристическом фоне.

Дженсен Хуанг утверждает, что Nvidia сокращает свое участие в проектах OpenAI и Anthropic, но его объяснение порождает больше вопросов, чем дает ответов.

Автор изображения: Патрик Т. Фэллон / Contributor / Getty Images В среду на конференции Morgan Stanley по технологиям, медиа и телекоммуникациям в центре Сан-Франциско генеральный директор Nvidia Дженсен Хуанг заявил, что недавние инвестиции его компании в OpenAI…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых