Vera CPU到着が示す「エージェント専用インフラ」の現実化

NVIDIAは自社設計初のCPU「Vera」を、サンフランシスコのAnthropic、Mission BayのOpenAI、Palo AltoのSpaceXAIへ金曜に出荷し、月曜にはSanta ClaraのOracle Cloud Infrastructureへも納入した。Hyperscale and HPC担当VPのIan Buckが直接手渡したという演出からも、NVIDIAがVeraを単なる新製品ではなく「エージェント時代の旗艦」と位置づけていることが読み取れる。

The first NVIDIA Vera CPUs arrived at three of the world's leading AI labs on Friday — Anthropic in San Francisco, OpenAI in Mission Bay, SpaceXAI in Palo Alto — followed by a delivery to Oracle Cloud Infrastructure in Santa Clara on Monday.

Veraはエージェントサンドボックスの実行を従来CPU比50%高速化し、Vera Rubin NVL72と組み合わせるとエージェントAI推論のトークン単価が10分の1になるとされる。事前学習中心の世代から、行動・観測・評価・更新を回す強化学習/エージェント中心の世代へ、インフラ要件が移っている。

Ineffable提携とGTC Taipeiが描く次の競争軸

同じタイミングで、AlphaGo設計者David Silverがロンドンで創業しステルスを抜けたばかりのIneffable Intelligenceと、NVIDIAがエンジニアリングレベルで提携することも公表された。Grace Blackwellで開始し、次世代Vera Rubinでも探索を続ける構成で、目標は「複雑かつリッチな環境での前例のない規模の強化学習」を可能にすることに置かれている。

GTC Taipei at COMPUTEXではAIファクトリー、スケーリングインフラ、エージェントAI、物理AIといったテーマが束ねて発表されており、Vera CPUとIneffable提携はその文脈の中核ピースに当たる。日本の開発現場にとっての含意は、(1)エージェント製品の単価設計がトークン1/10前提に書き換わること、(2)強化学習を本格運用する場合のリファレンス構成がGrace Blackwell〜Vera Rubin系に寄ること、(3)CPU選定もNVIDIA設計品が選択肢に入ることだ。Veraを直接調達できない企業も、利用クラウドのVera対応時期と価格を確認することが、来期のAI予算組みで実利のある最初の一手となる。