График зависимости оценки от длины контекста для различных моделей ИИ.

100 млн токенов — прощай RAG или просто новый уровень…

100 млн токенов — прощай RAG или просто новый уровень памяти?

Китайский стартап EverMind AI показал архитектуру MSA — и цифры выглядят как перебор: до 100 млн токенов контекста. Это примерно 200 книг в одной сессии.

Разберём без восторгов.

Что меняется:

— Трансформеры раньше «забывали» начало по мере роста контекста
— RAG решал это через поиск по базе, но часто терял связность
— MSA пытается держать всё сразу и доставать нужное по ходу

Фактически — попытка сделать память нативной, а не внешней.

Как это работает:

Sparse Attention + KV Compression — сжатие памяти и фокус только на важном
Document-wise RoPE + Interleave — понимание структуры документов и связей между ними

И всё это — на 2× A800 (80 ГБ VRAM), без безумных кластеров.

По заявлениям, при росте контекста с 16K до 100M точность падает менее чем на 9% — для таких объёмов это почти аномалия.

Но главный вопрос не в цифрах.

RAG — это не только про память, а про обновляемость и контроль источников.
А гигантский контекст — это всё ещё «загруженный мир», а не живые данные.

Вывод: MSA не убивает RAG, а двигает границу.
Теперь выбор — либо искать, либо помнить. И скоро эти подходы сольются в одно.

График зависимости оценки от длины контекста для различных моделей ИИ.
✅ Найденные теги: 100, RAG, новости, Токены, Уровень

ОСТАВЬТЕ СВОЙ КОММЕНТАРИЙ

Каталог бесплатных опенсорс-решений, которые можно развернуть локально и забыть о подписках

галерея

Футуристический транспорт на каменистой местности с человеком в скафандре.
Абстрактная 3D-сфера с синими и розовыми точками на тёмном фоне.
Иконка приложения Strava с уведомлением на экране смартфона.
ideipro logotyp
Женщина в офисе сидит за компьютером, закрывая лицо ладонями.
ideipro logotyp
Скриншот чата в Discord с обменом сообщениями и видео о "Компьютерном человеке".
МРТ-кабинет с современным медицинским оборудованием в футуристическом стиле.
График производительности и стоимости моделей на CursorBench.
Image Not Found
Женщина в офисе сидит за компьютером, закрывая лицо ладонями.

ИИ заставляет людей работать больше, а не меньше Об этом…

ИИ заставляет людей работать больше, а не меньше Об этом говорит свежее исследование компании ActivTrak. Она взяла за основу период за полгода до внедрения ИИ и через полгода после. Анализ затронул более чем 164 тысячи работников в…

Мар 22, 2026
ideipro logotyp

🔐 100 миллионов на безопасность: как хакеры помогают Яндексу становиться…

🔐 100 миллионов на безопасность: как хакеры помогают Яндексу становиться надежнее Всегда любопытно посмотреть, на какие суммы может рассчитывать талантливый багхантер, особенно на примере итогов программы Яндекса «Охота за ошибками» за 2025 год. Посмотреть на цифры более…

Мар 22, 2026
Скриншот чата в Discord с обменом сообщениями и видео о "Компьютерном человеке".

Бесплатная альтернатива Discord: в сети набирает популярность Fluxer — мессенджер…

Бесплатная альтернатива Discord: в сети набирает популярность Fluxer — мессенджер с открытым исходным кодом. Особенности: • Обладает практически тем же функционалом старого доброго Discord и выглядит очень похоже; • Можно создавать каналы для сообществ, запускать демонстрацию экрана…

Мар 22, 2026
МРТ-кабинет с современным медицинским оборудованием в футуристическом стиле.

Отзывы пациентов превратили в аналитику — клиники теперь видно насквозь…

Отзывы пациентов превратили в аналитику — клиники теперь видно насквозь ИИ начал разбирать отзывы о медицине — и вытаскивать из них реальную картину, без фильтров и «красивых отчётов». В России разработали систему LinguaMetrics, которая в режиме реального…

Мар 22, 2026

Впишите свой почтовый адрес и мы будем присылать вам на почту самые свежие новости в числе самых первых