Veraが意味する「エージェント特化CPU」への転換

NVIDIAが自社設計した初のCPU「Vera」が、Anthropic(サンフランシスコ)、OpenAI(Mission Bay)、SpaceXAI(パロアルト)の主要AIラボ3社に金曜日、続いてOracle Cloud Infrastructure(サンタクララ)に月曜日に届けられた。配送はNVIDIAのHyperscale and HPC担当バイスプレジデントIan Buckが自ら行ったと公式ブログに明記されている。

The first NVIDIA Vera CPUs arrived at three of the world's leading AI labs on Friday — Anthropic in San Francisco, OpenAI in Mission Bay, SpaceXAI in Palo Alto — followed by a delivery to Oracle Cloud Infrastructure in Santa Clara on Monday.

Veraを搭載するVera Rubin NVL72システムは、エージェントAI推論のトークンあたりコストを従来比10分の1に削減し、エージェントサンドボックスの実行速度を従来CPUと比較して50%高速化する。これはGPUではなくCPU側の刷新で、エージェント実行の経済性が一段動くことを意味する。

GTC TaipeiとIneffable提携が示す強化学習インフラの再編

同時に開催中のNVIDIA GTC Taipei at COMPUTEXでは、AIファクトリーとスケーリングインフラ、エージェントAI、フィジカルAIが主題に据えられた。さらにAlphaGo設計者David Silverが創業しロンドン拠点で先週ステルスを脱したIneffable Intelligenceと、強化学習インフラのエンジニアリングレベルの協業を発表。協業はGrace Blackwellで開始し、次世代Vera Rubinの最初期検証の一つとなる。

強化学習エージェントは固定データセットを使わず、行動・観測・スコアリング・更新を連続ループで回すため、事前学習とは別系統のインフラ要件を持つ。Veraがサンドボックス実行を50%速くする意味はここに直結し、CPU・GPU・RLワークロードの三位一体での再設計が、初期出荷先のラインナップから読み取れる構図になっている。