OpenAIが新モデル「GPT‑5.6 Sol」を公開した。同社はこれまでで最も堅牢な安全対策を組み込んだとし、高リスクなサイバー活動や繰り返される悪用に対するリアルタイムの保護を強化したと説明している。
特徴は、性能だけでなく安全対策の中身を前面に出した点である。専門家が実際に攻撃を試みる人手の攻撃検証(レッドチーミング)に加え、自動テストを大規模に実施し、A100換算で70万GPU時間超を投入したと開示した。生成AIの普及に伴いサイバー攻撃支援や悪用の懸念が増すなか、検証規模の数値開示は企業がAIを業務導入する際の判断材料になる。
あわせて、計画・反復・ツール連携を要するコマンドライン作業を測る指標「Terminal‑Bench 2.1」で新たな最高水準を記録したとも示している。安全性と実務性能の両面を打ち出した発表となった。
GPT‑5.6 Sol launches with our most robust safety stack yet. We strengthened real-time protections against high-risk cyber activity and repeated misuse, then spent weeks hardening the system with human red teaming and over 700,000 A100-equivalent GPU hours of automated testing.
GPT‑5.6 Sol sets a new state of the art on Terminal‑Bench 2.1, which tests complex command-line workflows requiring planning, iteration, and tool coordination.