Вайбкодеры, для вас — инструмент Headroom для экономии токенов на…
Вайбкодеры, для вас — инструмент Headroom для экономии токенов на тяжёлых задачах
Headroom сжимает выводы инструментов, файлы, логи и историю диалога перед отправкой в LLM, сокращая расход токенов на 60‑95%. В тестах на реальных рабочих нагрузках кодовая база сжалась на 92%, а поиск по коду — на 92% без потери качества (в бенчмарках GSM8K точность не изменилась, TruthfulQA даже выросла на 3%). Если модели понадобится что‑то из сжатых данных, она может запросить оригинал через механизм CCR.
Работает как библиотека (Python/TypeScript), прокси (headroom proxy), обёртка для агентов (headroom wrap claude|codex|cursor) или MCP-сервер. Поддерживает шесть алгоритмов сжатия, включая SmartCrusher для JSON, CodeCompressor для AST пяти языков и Kompress-base на Hugging Face. Есть кросс-агентная память и команда headroom learn, которая сама вылавливает неудачные сессии и прописывает правки в CLAUDE.md.
Спасаем долгие сессии — тут.


Добавить комментарий
Для отправки комментария вам необходимо авторизоваться.