Andrej Karpathyが公開した「autoresearch」は、AIがAI自身を改善する「自動研究AI」の最小構成実装として注目を集めている。PFNのブログ「Lunchtime Vol.67」でも、世界的に話題になっている事例として取り上げられた。

最大の特徴は、特別なエージェントフレームワークを使わない点にある。研究の進め方は「program.md」というMarkdownファイルに自然言語で書かれており、LLMはこの指示書を読んで実験を計画・実行・評価するループを自律的に回す。学習スクリプトであるtrain.pyは約600行のGPTフルスクラッチ実装で、Transformer・オプティマイザ・学習ループまでを含む。実験結果のグラフ生成やTSV出力もほぼ自動化されており、人間が就寝している一晩のあいだに約70回の実験を実行し、16種類のLLM改善手法を発見したと報告されている。

注目すべきは安全設計の実装例としての側面である。評価コード(evaluation)を改ざんしてスコアを偽装することを禁じるルールも、自然言語でprogram.md内に明示されている。reward hackingへの対策をシステムプロンプトレベルで記述する具体的なサンプルが公開された形であり、自律エージェントの制約設計を学ぶうえでの参照価値が高い。

波及範囲は広い。データとMarkdownを差し替えるだけで、LLM以外の機械学習タスクや実験的研究にも転用できる構造になっているためだ。重厚なエージェント基盤を組まずとも研究サイクルが自動化できることが示されたことで、個人研究者や小規模R&Dチームでも夜間バッチでの自動実験が現実的な選択肢に入った。