Karpathyの自動研究AI、一晩で70実験｜Markdown指示のみ

学術日本 GitHub 05/19 14:02

AI TREND

Andrej Karpathy：自動研究AI公開

Andrej Karpathyが公開した「autoresearch」が、Markdownファイル（program.md）に書かれた自然言語指示だけで動作し、一晩に約70回の実験を自律実行してLLM改善手法を16種類発見した事例として話題になっている。

3 の要点を3分で

Andrej Karpathyが公開した「autoresearch」は、AIがAI自身を改善する「自動研究AI」の最小構成実装として注目を集めている。PFNのブログ「Lunchtime Vol.67」でも、世界的に話題になっている事例として取り上げられた。

最大の特徴は、特別なエージェントフレームワークを使わない点にある。研究の進め方は「program.md」というMarkdownファイルに自然言語で書かれており、LLMはこの指示書を読んで実験を計画・実行・評価するループを自律的に回す。学習スクリプトであるtrain.pyは約600行のGPTフルスクラッチ実装で、Transformer・オプティマイザ・学習ループまでを含む。実験結果のグラフ生成やTSV出力もほぼ自動化されており、人間が就寝している一晩のあいだに約70回の実験を実行し、16種類のLLM改善手法を発見したと報告されている。

注目すべきは安全設計の実装例としての側面である。評価コード（evaluation）を改ざんしてスコアを偽装することを禁じるルールも、自然言語でprogram.md内に明示されている。reward hackingへの対策をシステムプロンプトレベルで記述する具体的なサンプルが公開された形であり、自律エージェントの制約設計を学ぶうえでの参照価値が高い。

波及範囲は広い。データとMarkdownを差し替えるだけで、LLM以外の機械学習タスクや実験的研究にも転用できる構造になっているためだ。重厚なエージェント基盤を組まずとも研究サイクルが自動化できることが示されたことで、個人研究者や小規模R&Dチームでも夜間バッチでの自動実験が現実的な選択肢に入った。

Karpathyの自動研究AI、一晩で70実験｜Markdown指示のみの本文内説明図 — 図解: Markdown1枚で回る自動研究ループ - 指示書→自律実験→評価ゲート→16手法の構造

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

特別なエージェント基盤を使わずMarkdown指示書のみで研究を自律化
人間の就寝中に約70回実験を回し16種類の改善手法を自動発見
評価コード改ざん禁止などズル防止ルールも自然言語で明示

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: Andrej Karpathy
何を: 自動研究AI公開
いつ: 話題化中
どこで: GitHub
なぜ: 研究自動化
どのように: Markdown指示

何が起きたか

Andrej Karpathyが公開した「autoresearch」が、Markdownファイル（program.md）に書かれた自然言語指示だけで動作し、一晩に約70回の実験を自律実行してLLM改善手法を16種類発見した事例として話題になっている。

3つの視点で読む

技術 / 事業 / 規制 — この変化があなたの判断にどう効くか。

技術への影響

LangChainやAutoGPTのような専用エージェントフレームワークを介さず、Markdownの自然言語指示と評価スクリプトだけで研究ループを成立させている。約600行のtrain.pyとprogram.mdという最小構成で「AIがAIを改善する」サイクルが動く実装が公開されたことで、エージェント設計の前提が一段シンプル化した。

市場・事業への影響

research engineerの試行錯誤の一部が、夜間バッチで自動消化できる対象に入った。データとMarkdownを差し替えるだけで他領域に転用できる構造のため、社内R&Dや受託研究の工数配分を見直す具体材料になる。PFNの解説記事として日本語で詳細が共有されたことで、国内開発現場でも参照可能な事例となった。

規制・リスク

評価コード（evaluation）の改ざん禁止を自然言語で明示するという制約設計は、自律エージェントの安全設計の実装例として参照価値が高い。reward hacking対策をシステムプロンプトレベルで記述する手法の具体的サンプルが公開された。

機会と脅威

この変化で機会を得るのは誰か、脅威にさらされるのは誰か。

機会 3

個人研究者・小規模R&Dチーム

高価なエージェント基盤や大規模インフラなしで、夜間に自動実験を回せる構成が共有された

Andrej Karpathy / 教育用途のOSSコミュニティ

nanoGPT系の流れを汲む最小構成実装が再び注目を集め、学習教材としての価値が高まった

国内AI研究現場（PFNなど）

日本語でいち早く解説が出たことで、社内の自動研究ループ導入の議論材料が揃った

脅威 2

重厚なエージェントフレームワーク

Markdown1枚で同等の研究ループが動く事例が出たことで、フレームワーク選定の必然性が問い直される

単純な探索作業に偏ったresearch engineer業務

夜間バッチで自動化できる試行錯誤の範囲が具体的に示され、人間の介在価値の再定義が必要になる

今やるべきこと

立場別、明日から動ける一手。

技術を選ぶ人へ

autoresearchのprogram.mdに記述された制約条件と評価ルールの構造を確認し、自社で同等の自律ループを設計する際の指示書テンプレートとして比較する。

事業を決める人へ

自社R&Dで「夜間に自動で回せる実験」と「人間が判断すべき実験」の境界を、autoresearchの16手法発見の粒度を基準に定義する。

手を動かす人へ

公開されているautoresearchリポジトリをローカルで動かし、約600行のtrain.pyと自然言語指示だけで研究ループが回る挙動を実機で測る。

時系列タイムライン

公開時 Andrej Karpathyがautoresearchリポジトリを公開
公開後一晩で約70回の実験を自律実行し16種類の改善手法を発見との報告
2026年5月19日 PFNブログ「Lunchtime Vol.67」で日本語解説記事が公開

情報ソース

学術の記事

読み込み中...

Andrej Karpathy：自動研究AI公開

関連リンク

時系列タイムライン

SNSの反応

主な声

関連コンテンツ

関連キーワード

関連するAIトレンド記事

情報ソース

人気記事ランキング

学術の記事