Архив рубрики ~Коротко из Telegram~

🌟 Одна из главных проблем agentic AI — стоимость длинных…

02.06.2026

🌟 Одна из главных проблем agentic AI — стоимость длинных циклов работы. Каждый новый шаг агента тащит за собой весь предыдущий контекст, из-за чего расход токенов растёт не линейно, а почти квадратично.

В статье показали несколько способов, как это сокращают:
— recursive summarization вместо хранения полной истории;
— distilled system prompts с короткими инструкциями;
— RAG-память через vector DB;
— LLMLingua для удаления “мусорных” токенов.

➡️ Пример из статьи:
обычный prompt на 42 токена сократили до 12 без потери смысла, а summarization уменьшил общий контекст со 109 до 36 токенов.

Сейчас индустрия постепенно приходит к тому, что memory management становится не менее важным, чем сами модели. Потому что при масштабных agent loops стоимость контекста начинает убивать inference быстрее, чем качество модели помогает.

❓ Как думаешь, будущее AI-агентов — это большие context windows или агрессивное сжатие памяти?

ИдеиPRO

Оцените материал:

Читайте также

Архив рубрики ~Лента новостей~ Треть запросов ChatGPT к поиску — повторы. Разобрал 591 ответ: почему одних цитируют всегда, а других — через раз Архив рубрики ~Лента новостей~ Google переименовала NotebookLM в Gemini Notebook Новости робототехники Телеуправляемый андроид Unitree G1 прооперировал свиней. Им лапароскопически удалили желчный пузырь Новости робототехники Weave Robotics запускает Айзека, своего первого представителя робота-гуманоида Архив рубрики ~Лента новостей~ 5 ошибок менеджера, внедряющего ИИ Архив рубрики ~Лента новостей~ Конец эпохи «дешевых промптов»: как ИИ-инфляция меняет правила игры для бизнеса Архив рубрики ~Лента новостей~ Директор Amazon по искусственному интеллекту заявил на конференции VB Transform 2026, что не возможности ИИ-агентств препятствуют их внедрению в корпоративной среде из-за низкой надежности. Архив рубрики ~Лента новостей~ Как мы вынесли семантический поиск на обычный сервер без видеокарты, облака и выделенной поисковой системы Архив рубрики ~Лента новостей~ Обсерватория Einstein Probe заметила слияние шести галактик в центре скопления галактик. Это крайне редкое явление в Местной Вселенной Новости робототехники Страх перед человекоподобными роботами подтолкнул рабочих к забастовке на автомобильном заводе Hyundai. Новости робототехники Основатель Максимо рассказывает, как робототехника строит строительство солнечной энергетики. Архив рубрики ~Лента новостей~ Европейский ИИ: что там вообще происходит? Архив рубрики ~Лента новостей~ «Яндекс Путешествия» запустили раздел для анализа спроса, цен и продаж для отелей Архив рубрики ~Лента новостей~ 2 миллиона токенов против 1 миллиона у OpenAI и Anthropic. Чем Google хочет выиграть гонку AI-флагманов Архив рубрики ~Лента новостей~ Треть запросов ChatGPT к поиску — повторы. Разобрал 591 ответ: почему одних цитируют всегда, а других — через раз Архив рубрики ~Лента новостей~ Google переименовала NotebookLM в Gemini Notebook Новости робототехники Телеуправляемый андроид Unitree G1 прооперировал свиней. Им лапароскопически удалили желчный пузырь Новости робототехники Weave Robotics запускает Айзека, своего первого представителя робота-гуманоида Архив рубрики ~Лента новостей~ 5 ошибок менеджера, внедряющего ИИ Архив рубрики ~Лента новостей~ Конец эпохи «дешевых промптов»: как ИИ-инфляция меняет правила игры для бизнеса Архив рубрики ~Лента новостей~ Директор Amazon по искусственному интеллекту заявил на конференции VB Transform 2026, что не возможности ИИ-агентств препятствуют их внедрению в корпоративной среде из-за низкой надежности. Архив рубрики ~Лента новостей~ Как мы вынесли семантический поиск на обычный сервер без видеокарты, облака и выделенной поисковой системы Архив рубрики ~Лента новостей~ Обсерватория Einstein Probe заметила слияние шести галактик в центре скопления галактик. Это крайне редкое явление в Местной Вселенной Новости робототехники Страх перед человекоподобными роботами подтолкнул рабочих к забастовке на автомобильном заводе Hyundai. Новости робототехники Основатель Максимо рассказывает, как робототехника строит строительство солнечной энергетики. Архив рубрики ~Лента новостей~ Европейский ИИ: что там вообще происходит? Архив рубрики ~Лента новостей~ «Яндекс Путешествия» запустили раздел для анализа спроса, цен и продаж для отелей Архив рубрики ~Лента новостей~ 2 миллиона токенов против 1 миллиона у OpenAI и Anthropic. Чем Google хочет выиграть гонку AI-флагманов

Оставить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

🤖 Нельсон AI

✍️ Печатает...

Готов помочь

База знаний по нейросетям 41