Новая агентная структура памяти использует 118 000 токенов на запрос. LangMem расходует 3,26 млн токенов.
Бен Диксон
Анализ долгосрочных перспектив выявляет ключевой недостаток агентов ИИ: контекстные окна быстро заполняются, а конвейеры поиска возвращают шум вместо полезной информации.
Для решения этой проблемы исследователи из Национального университета Сингапура разработали MRAgent — фреймворк, который отказывается от статического подхода «извлечение-затем-рассуждение». Вместо этого он использует механизм, позволяющий агенту динамически развивать свою память на основе накапливающихся данных.
Эта многоэтапная реконструкция памяти интегрирована в процесс рассуждений большой языковой модели (LLM). Хотя это не единственная платформа в этой области, MRAgent значительно снижает потребление токенов и затраты времени выполнения по сравнению с другими подходами к управлению памятью с помощью агентов.
Ограничения пассивного извлечения информации в задачах с длительным горизонтом анализа.
В классических алгоритмах поиска документы извлекаются с помощью векторного поиска или обхода графа и передаются в LLM для рассуждений. Этот пассивный подход неэффективен, поскольку он не может объединить рассуждения с доступом к памяти, создавая три основных узких места:
-
Эти системы не могут пересматривать свою стратегию поиска в процессе обработки информации. Если агент получает документ и обнаруживает важную недостающую подсказку — конкретную дату или имя человека — у него нет возможности сформировать новый запрос на основе этой находки.
-
Фиксированные показатели сходства и предопределенные расширения графа возвращают поверхностные совпадения, которые заполняют контекстное окно LLM нерелевантным шумом, ухудшая качество рассуждений.
-
Современные системы в значительной степени полагаются на предварительно созданные структуры, такие как k лучших результатов и статические функции релевантности, что ограничивает гибкость, необходимую для масштабирования в условиях непредсказуемого взаимодействия пользователей на длительном горизонте.
Исследователи утверждают, что для преодоления этих ограничений разработчикам необходимо перейти к «активному и ассоциативному процессу реконструкции», концепции, вдохновленной когнитивной нейронаукой.

В рамках этой парадигмы воспроизведение информации из памяти происходит последовательно, а не в виде пассивного считывания данных из статической базы данных. Система начинает работу с небольших, конкретных подсказок от пользователя, таких как имя человека, действие или место. Эти первоначальные указания указывают на взаимосвязь понятий или категорий, а не на массивные блоки текста.
Следуя этим этапам обработки метаданных, агент собирает небольшие фрагменты доказательств один за другим. Он использует каждую новую информацию, чтобы направлять свои следующие шаги, пока не соберет воедино полную и точную картину.
Как MRAgent реализует активную реконструкцию памяти
Вместо того чтобы рассматривать память как статическую базу данных, MRAgent (Memory Reasoning Architecture for LLM Agents) рассматривает ее как интерактивную среду. При обработке сложного запроса агент использует возможности логического мышления базовой архитектуры LLM для исследования множества возможных путей извлечения данных в структурированном графе памяти.
На каждом этапе LLM оценивает собранные промежуточные данные и использует их для итеративной оптимизации поиска. Он выводит новые ограничения поиска, следует путям с наиболее полной информацией и отсеивает нерелевантные ветви. Это позволяет MRAgent собирать воедино глубоко скрытую информацию, не заполняя контекст LLM шумом.

Для обеспечения вычислительной эффективности и масштабируемости этого активного исследования, фреймворк организует свою базу данных с помощью механизма «Cue-Tag-Content». Он функционирует как многоуровневый ассоциативный граф с тремя типами узлов:
-
Подсказки : Детально точные ключевые слова, такие как сущности или контекстные атрибуты, извлеченные из взаимодействий пользователя.
-
Содержание: Фактически хранимые в памяти блоки. Они разделены на многоуровневые структуры, такие как эпизодическая память для конкретных событий и семантическая память для устойчивых фактов и пользовательских предпочтений.
-
Теги: Семантические мосты, обобщающие взаимосвязи между конкретными подсказками и содержанием.
Эта структура обеспечивает высокоэффективный двухэтапный процесс поиска. Сначала LLM переходит от подсказок к потенциальным тегам. Поскольку теги явно отображают семантические связи и структурные ассоциации данных, агент оценивает эти краткие описания, чтобы определить их релевантность. LLM определяет перспективные пути обхода и отбрасывает нерелевантные ветви, прежде чем тратить вычислительные ресурсы и токены запросов на доступ к подробному, объемному содержимому памяти.
Например, пользователь может спросить у ИИ-агента: «Как Нейт распорядился призовыми деньгами, когда выиграл свой третий турнир по видеоиграм?»
-
MRAgent сначала извлекает из запроса точные начальные подсказки, такие как «Нейт», «турнир по видеоиграм» и «победа».
-
Агент сопоставляет эти первоначальные подсказки с графом памяти и анализирует доступные ассоциативные теги, связанные с ними. Агент видит такие теги, как «Победа в турнире» и «Участие в турнире». Поскольку его интересует только то, что человек делал после победы в чемпионате, MRAgent отбрасывает тег «Участие в турнире» и переходит к тегу «Победа».
-
Агент извлекает эпизодический контент, связанный с выбранной парой «подсказка-тег», и воспроизводит три различных эпизода воспоминаний, в которых Нейт выиграл турнир.
-
MRAgent анализирует три воспоминания, решает, что одно из них особенно важно для запроса, и отбрасывает два других.
-
Получив эту информацию, агент обновляет свои подсказки и начинает новый этап обнаружения и отсеивания. Из новых эпизодических воспоминаний агент добавляет к своим подсказкам «заработок на турнире» и использует это для обхода новых тегов и поиска новых воспоминаний. Он повторяет этот процесс до тех пор, пока не соберет достаточно информации для ответа на запрос, который может звучать примерно так: «Нейт сэкономил деньги».
Показатели эффективности MRAgent по отраслевым стандартам
MRAgent работает совместно с несколькими другими фреймворками, предназначенными для построения агентной памяти. Альтернативами являются A-MEM, фреймворк для агентной памяти на основе графов, и MemoryOS, иерархический фреймворк для памяти. К другим фреймворкам для постоянной памяти относятся LangMem и Mem0.
Исследователи протестировали MRAgent на отраслевых бенчмарках LoCoMo и LongMemEval. Эти бенчмарки проверяют способность агентов решать запросы в рамках долгосрочных задач и диалогов, охватывающих десятки сессий и сотни реплик. В качестве базовых моделей использовались Gemini 2.5 Flash и Claude Sonnet 4.5. Система тестировалась на стандартных платформах RAG, A-MEM, MemoryOS, LangMem и Mem0.
MRAgent неизменно превосходил все базовые показатели по обеим моделям и всем типам вопросов со значительным отрывом.
Однако для корпоративных разработчиков наиболее важным показателем часто является вычислительная стоимость. В тестах LongMemEval MRAgent сократил потребление токенов запроса до всего 118 тыс. на выборку. Для сравнения, A-Mem потреблял 632 тыс. токенов, а LangMem — 3,26 млн токенов на запрос. MRAgent также фактически вдвое сократил время выполнения по сравнению с A-Mem, уменьшив его с 1122 секунд до 586 секунд.

Эффективность MRAgent на практике обусловлена его поведением по запросу. Оценка тегов и удаление нерелевантных путей перед поиском экономит средства и контекстное пространство. Кроме того, система автономно оценивает накопленный контекст и автоматически знает, когда следует прекратить поиск, полностью избегая избыточного анализа данных.
Реализация и разработка имеют свои особенности.
Хотя MRAgent очень эффективен, структуру Cue-Tag-Content необходимо подготовить до того, как агент сможет к ней обращаться. Разработчики должны понять, как спроектировать базовую базу данных в памяти, чтобы LLM мог эффективно перемещаться по ассоциативным элементам и отсеивать нерелевантные пути без чрезмерного увеличения вычислительных затрат.
К счастью, разработчикам не нужно вручную размечать или структурировать эти данные. Авторы разработали MRAgent с автоматизированным конвейером обработки данных, который использует LLM для обработки необработанных историй взаимодействий и автоматического заполнения графа памяти. Задача разработчика состоит в том, чтобы реализовать и организовать этот автоматизированный конвейер обработки данных, а не размечать данные вручную.
Вам необходимо настроить фоновое задание или потоковый конвейер, который будет передавать необработанные данные о взаимодействии пользователя через шаблоны подсказок для извлечения этих метаданных перед сохранением их в вашей графовой базе данных.
Однако авторы подчеркивают, что это лишь этап упрощения конструкции, и компания MRAgent намеренно делает процесс приема максимально простым.
Авторы опубликовали код на GitHub.

Подпишитесь, чтобы получать самые свежие новости!
Подробные аналитические данные для руководителей предприятий в области искусственного интеллекта, данных и безопасности.
VB Daily AI Weekly Еженедельник AGI Еженедельник по безопасности Еженедельник по инфраструктуре данных Все они
Отправляя свой адрес электронной почты, вы соглашаетесь с нашими Условиями использования и Политикой конфиденциальности.
Получайте обновления ! Вы подписаны! Наши последние новости скоро поступят на вашу электронную почту.
Источник: venturebeat.com
Оцените материал:
Присоединяйтесь и подпишитесь на рассылку самых свежих новостей по Email
Получайте свежие новости и идеи на почту. Без спама — только самое интересное.
Нажимая «Подписаться», вы соглашаетесь с политикой конфиденциальности.
