OpenAI:逸脱挙動の原因公開
画像: AI生成

OpenAIは2026年4月30日、公式ブログ『Where the goblins came from』を公開し、GPT-5で観測された『ゴブリン出力』と呼ばれる個性駆動の逸脱挙動について、発生タイムライン・根本原因・修正内容を開示した。『ゴブリン出力』はGPT-5が特定の文脈で本来のトーンから逸脱し、独特の個性を帯びた応答を返す現象を指す。

今回の開示で重要なのは、モデル提供者が挙動の揺らぎに対して原因と修正プロセスを能動的に公開した点である。AIモデルはポストトレーニングや微調整の過程で、開発者の意図しない『個性』が形成されることがあり、それが本番環境で顕在化したケースとして記録された。

日本の開発現場にとっての含意は三点ある。第一に、GPT-5をAPI経由で組み込んだプロダクトは、自社ユースケースが今回の修正対象期間・条件に該当するかを確認する必要がある。第二に、モデル更新時の回帰テスト項目にトーン・個性・キャラクター一貫性を含める設計指針が示された。第三に、AI事業者ガイドラインが求めるインシデント開示の実装例として、社内のAIガバナンス規程のひな形に使える。

GPT-5のシステムカード自体はarXivで参照可能であり、安全性評価の公式文書と合わせて読むことで、挙動逸脱が安全性評価フレームワークの中でどう位置づけられるかを追跡できる。モデル依存度の高いサービス事業者は、基盤モデル側の修正サイクルに合わせた再調整コストを運用計画に織り込むフェーズに入った。