AnthropicはClaude Managed Agentsに3つの新機能を追加した。過去セッションを振り返ってパターンを抽出し自己改善する「dreaming」(リサーチプレビュー)、出力を独立コンテキストで採点し合格まで再試行させる「outcomes」(パブリックベータ)、複数エージェントを分担実行する「multiagent orchestration」(パブリックベータ)だ。webhooksも開発者に提供される。

outcomesは標準プロンプトループ比でタスク成功率を最大10ポイント改善し、内訳はdocx +8.4%pptx +10.1%。実利用ではHarveyがdreaming活用で完了率約6倍Wisedocsがoutcomesでレビュー50%高速化を報告している。

核心は、人間が逐一レビューせずともエージェントが自ら検証・自己修正し、セッションをまたいで学習し続ける構成が一次提供された点。長時間・複雑業務の自動化を検討する開発者の意思決定に直結する。本番投入時はリサーチプレビューとパブリックベータの境界、そして再試行に伴うコスト増の見積もりが判断のカギになる。