MIT CSAILのAlex L. Zhang・Tim Kraska・Omar Khattabが発表した再帰言語モデル(RLM)は、長いプロンプトを「外部環境」として扱い、最上位のモデルが全文を直接読まずに、コードを書いて分割・検索し、子RLMを再帰的に呼び出す推論手法。ネイティブのコンテキストウィンドウを最大100倍(2桁)超える入力を処理できる。論文は2025年12月31日初版、v3が2026年5月11日

ベンチマークでは対GPT-5の長文4タスクで、要約圧縮比+26%・自己呼び出し型コード実行比+130%Claude Code+13%(中央値)。OOLONG(13.2万トークン)ではRLM(GPT-5-mini)がGPT-5を約114%上回りAPIコスト同等。小型のRLM-Qwen3-8Bは素のQwen3-8B比+28.3%

Anthropicは2026年5月28日、Claude Codeにdynamic workflows(研究プレビュー)を公開。最大16並列・最大1,000サブエージェントを起動し敵対的レビューで検証する仕組みで、論文の思想を製品化した。第一著者本人がOpus 4.8+dynamic workflowsを「初のRLM訓練事例」と公言している。