Image

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base

07903b15a10f8bdd871656fd4af1b6f4

Модель хороша тем, что даёт почти уровень больших LLM на длинных контекстах, но при этом заметно экономит память и работает быстрее за счёт линейной архитектуры.

Что улучшили:

— требует до 75% меньше памяти на KV-кэш

— до 6.3? быстрее декодирование на длинных контекстах

Как устроена:

— гибридный подход: Kimi Delta Attention + MLA

— модель хорошо оптимизирована под длиннный контекст и высокую пропускную способность

По бенчмаркам модель обгоняет и MLA, и GDN-H, включая задачи с длинным контекстом. В задачах на рассуждения и длинную RL-генерацию Kimi-Linear показывает заметно лучшие результаты, чем MLA.

Архитектура модели пример того, как линейные attention-архитектуры выходят на уровень, где они конкурируют с классическими решениями не только по скорости, но и по качеству.

Github: github.com/MoonshotAI/Kimi-Linear

Hf: https://huggingface.co/moonshotai/Kimi-Linear-48B-A3B-Instruct

Источник: huggingface.co

Источник: ai-news.ru

✅ Найденные теги: Kimi, новости

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Цифровая сеть и технологическая сфера, соединенные световым потоком.
Модель атома с ядром и вращающимися электронами на темном фоне.
Флуоресцентное изображение эмбриона синих и фиолетовых оттенков на черном фоне.
Компания GE HealthCare запускает новую ультразвуковую систему для диагностики сердечно-сосудистых заболеваний.
ideipro logotyp
Лидеры здравоохранения обсуждают «пузырь» искусственного интеллекта, часть 2 | MobiHealthNews
Смартфон с открытым сайтом Medicare.gov на экране, онлайн-сервис здравоохранения.
ideipro logotyp
Ноутбук с программой редактирования изображений, яркое фото человека в синем плаще.
Image Not Found
Цифровая сеть и технологическая сфера, соединенные световым потоком.

Разница между начинающими и опытными специалистами по анализу данных заключается не в коде.

Почему моя одержимость сложными алгоритмами на самом деле тормозила мою карьеру. Делиться Изображение предоставлено автором (создано с помощью Nano Banana Pro) Если вы потратите пять минут на LinkedIn или что-то подобное, вы заметите острую дискуссию в индустрии…

Мар 5, 2026
Модель атома с ядром и вращающимися электронами на темном фоне.

Тайна ядерных «магических чисел» наконец-то разгадана.

Математический аналог микроскопа с переменным разрешением пролил свет на то, почему некоторые атомы обладают исключительной стабильностью — загадку, которая десятилетиями оставалась неразгаданной в ядерной физике. Некоторые атомы кажутся особенно стабильными из-за количества протонов и нейтронов в них.…

Мар 5, 2026
Флуоресцентное изображение эмбриона синих и фиолетовых оттенков на черном фоне.

Обнаружена неожиданно высокая организованность ДНК на самой ранней стадии развития эмбриона

Ранний эмбрион дрозофилы, запечатленный во время волны деления ядра. Делящиеся ядра (синие) и неделящиеся ядра (розовые) иллюстрируют быстрый, высокоорганизованный характер раннего развития и существенную регуляцию организации генома, необходимую для правильной активации генов, несмотря на многократные нарушения в…

Мар 5, 2026
Компания GE HealthCare запускает новую ультразвуковую систему для диагностики сердечно-сосудистых заболеваний.

Компания GE HealthCare запускает новую ультразвуковую систему для диагностики сердечно-сосудистых заболеваний.

Компания GE HealthCare недавно получила маркировку CE и разрешение FDA 510(k) на свою систему. Фото: Poetra.RH / Shutterstock.com. Компания GE HealthCare представила Vivid Pioneer, новую систему ультразвуковой диагностики сердечно-сосудистой системы, которая использует искусственный интеллект для повышения скорости…

Мар 5, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых