NVIDIAは画像認識の国際学会CVPRで、自動運転・ロボット・映像AIの開発を加速する「物理AIエージェント技能(physical AI agent skills)」群を公開した。基盤モデルCosmos 3やシミュレーション基盤と組み合わせ、現実の場面再現から学習・評価までの一連の作業をAIエージェントに自動化させる狙いがある。多くがオープンソースとして配布される。

具体的には、自動運転向けに走行データから編集可能な3次元場面を作るNeural Reconstruction技能や、画像から高速に道路場面を再構築するInstantNuRecを提供する。320億パラメータの推論型・視覚言語行動モデルAlpamayo 2 Superをオープンで公開し、レベル4自動運転の開発を支える。映像検査向けには実画像から多様な欠陥例を生成する技能を、医療ロボット向けには手術データから学ぶCosmos-H-Surgical-Simulatorを公開した。

物理AI開発で最大の壁となる「めったに起きない事例(ロングテール)」のデータ不足を、合成データ生成と閉ループ模擬で埋める手段が一括で揃った点が重要だ。CVPR 2026採択論文の多くでNVIDIA技術が参照されており、研究現場の事実上の標準としての地位が示された。