Закажи экспресс-аудит своего дела онлайн всего за 199 ₽
и получи рекомендации по улучшению - Жми сюда !

100 млн токенов — прощай RAG или просто новый уровень…

100 млн токенов — прощай RAG или просто новый уровень памяти?

Китайский стартап EverMind AI показал архитектуру MSA — и цифры выглядят как перебор: до 100 млн токенов контекста. Это примерно 200 книг в одной сессии.

Разберём без восторгов.

Что меняется:

— Трансформеры раньше «забывали» начало по мере роста контекста
— RAG решал это через поиск по базе, но часто терял связность
— MSA пытается держать всё сразу и доставать нужное по ходу

Фактически — попытка сделать память нативной, а не внешней.

Как это работает:

Sparse Attention + KV Compression — сжатие памяти и фокус только на важном
Document-wise RoPE + Interleave — понимание структуры документов и связей между ними

И всё это — на 2× A800 (80 ГБ VRAM), без безумных кластеров.

По заявлениям, при росте контекста с 16K до 100M точность падает менее чем на 9% — для таких объёмов это почти аномалия.

Но главный вопрос не в цифрах.

RAG — это не только про память, а про обновляемость и контроль источников.
А гигантский контекст — это всё ещё «загруженный мир», а не живые данные.

Вывод: MSA не убивает RAG, а двигает границу.
Теперь выбор — либо искать, либо помнить. И скоро эти подходы сольются в одно.

График зависимости оценки от длины контекста для различных моделей ИИ.
✅ Найденные теги: 100, RAG, новости, Токены, Уровень

Добавить комментарий

Нет других записей в этой рубрике.

Новости других рубрик

Архив рубрики ~Коротко из Telegram~: ИИ становится универсальным переводчиком между профессиями: он делает сложные темы… Архив рубрики ~Коротко из Telegram~: Забираем любые шрифты с сайтов — забираем бесплатный инструмент Font… Архив рубрики ~Коротко из Telegram~: От роботов-штукатуров до умного Мурманска: чем запомнится ПМЭФ-2026 строителям Делегации… Архив рубрики ~Коротко из Telegram~: Легенда Ютуба PewDiePie выпустил бесплатный Cursor — его личную замену… Архив рубрики ~Коротко из Telegram~: Платформенная занятость как ответ на кадровый голод На сессии ПМЭФ… Архив рубрики ~Коротко из Telegram~: И еще новости про MVNO с полей ПМЭФ! Виртуальный мобильный… Архив рубрики ~Коротко из Telegram~: Впервые в истории: ботов в интернете больше, чем живых людей… Архив рубрики ~Коротко из Telegram~: В умных очках Meta¹ нашли скрытую функцию, которая распознаёт прохожих…