AIエージェントがLLMへ送るツール出力・ログ・検索結果・会話履歴を、送信前にローカルで圧縮するオープンソースHeadroomがGitHubで1日あたり+2,473スターと急上昇している。同じ回答を保ったままトークン量を60〜95%削減でき、実ワークロードでは17,765→1,408トークン(最大92%削減)の実測値を提示している。
特徴は、元データを捨てずローカルに残し必要時にLLMが取り戻せる可逆圧縮(CCR)を採る点だ。内容の種類(JSON・ソースコード・文章)を自動判別して圧縮方式を使い分ける。標準ベンチのGSM8K・TruthfulQAで精度がほぼ維持されたと報告されている。
提供形態はライブラリ・中継サーバー(プロキシ)・MCPサーバーの3つで、コード改変なしに既存のClaude・Codex・Cursorへ差し込める。複数エージェント間で共有メモリも持てる。削減率はワークロード依存のため、自社データでの実測が導入判断の前提になる。