DeNAのチームが、社内のツール利用申請を代行するAIエージェントの指示文(プロンプト)を、自律型AIエンジニア「Devin」に毎週自動改善させる仕組みを公開した。Devinの手順書(Playbook)と定期実行(Scheduled Sessions)を組み合わせ、毎週月曜朝9時に自動実行する。

改善の入力は、承認者からの差し戻しコメントと、観測基盤Langfuseに蓄積した会話の記録だ。ここからつまずきを集め、繰り返し出るものだけを採用する。6月の4週で計4本の改善が入り、法務確認まわりの選択ミスは同じ箇所に3週かけて修正された。

参考になる核心は、完全自動化せず役割を区切った点にある。歯止めとして、プロンプト本文のみ編集可・行数上限・テスト全通過必須・下書き限定・自動マージ禁止を設定し、最終判断は人間が行う。つまずきの多くが「判断基準がそもそも書かれていなかった」ことに起因するという観察も、プロンプト設計の実務知見として有用だ。