AIエージェントがLLMへ送る前のデータ(ツール出力・ログ・検索結果・ファイル・会話履歴)を手元で圧縮するオープンソースツールHeadroomが、GitHubで本日+1,266★と急上昇している。公式はトークンを60〜95%削減しても同じ回答を保つと説明し、入力1万トークン超を約1,260トークンへ縮めた実例を示す。
特徴は、圧縮をLLM到達前のローカル処理に置くことと、元データを消さず必要時に取り出せる可逆圧縮(CCR)を採る点にある。導入方式はライブラリ・中継サーバー(プロキシ)・既存エージェントへの自動組み込み・標準連携規格(MCP)の4方式で、PythonとTypeScriptに対応しDocker版も提供される。
精度はGSM8K・TruthfulQAなど標準ベンチで維持〜微増と報告。Claude・Codex・Geminiをまたいで記憶を共有できる構成のため、コストと遅延に悩む開発現場が試しやすい選択肢として注目されている。