NVIDIA Vera CPU出荷開始｜エージェント推論コスト1/10へ

AI TREND

NVIDIA：Vera CPU出荷開始

NVIDIAが自社設計初のCPU「Vera」を主要AIラボへ出荷開始し、同時にGTC Taipeiでエージェント・物理AI向けインフラを発表、Ineffable Intelligenceとの強化学習インフラ提携も公開した。

3 の要点を3分で

Vera CPU到着が示す「エージェント専用インフラ」の現実化

NVIDIAは自社設計初のCPU「Vera」を、サンフランシスコのAnthropic、Mission BayのOpenAI、Palo AltoのSpaceXAIへ金曜に出荷し、月曜にはSanta ClaraのOracle Cloud Infrastructureへも納入した。Hyperscale and HPC担当VPのIan Buckが直接手渡したという演出からも、NVIDIAがVeraを単なる新製品ではなく「エージェント時代の旗艦」と位置づけていることが読み取れる。

The first NVIDIA Vera CPUs arrived at three of the world's leading AI labs on Friday — Anthropic in San Francisco, OpenAI in Mission Bay, SpaceXAI in Palo Alto — followed by a delivery to Oracle Cloud Infrastructure in Santa Clara on Monday.
出典: Vera Arrives: NVIDIA's First CPU Built for Agents Lands at Top AI Labs

Veraはエージェントサンドボックスの実行を従来CPU比50%高速化し、Vera Rubin NVL72と組み合わせるとエージェントAI推論のトークン単価が10分の1になるとされる。事前学習中心の世代から、行動・観測・評価・更新を回す強化学習/エージェント中心の世代へ、インフラ要件が移っている。

Ineffable提携とGTC Taipeiが描く次の競争軸

同じタイミングで、AlphaGo設計者David Silverがロンドンで創業しステルスを抜けたばかりのIneffable Intelligenceと、NVIDIAがエンジニアリングレベルで提携することも公表された。Grace Blackwellで開始し、次世代Vera Rubinでも探索を続ける構成で、目標は「複雑かつリッチな環境での前例のない規模の強化学習」を可能にすることに置かれている。

GTC Taipei at COMPUTEXではAIファクトリー、スケーリングインフラ、エージェントAI、物理AIといったテーマが束ねて発表されており、Vera CPUとIneffable提携はその文脈の中核ピースに当たる。日本の開発現場にとっての含意は、(1)エージェント製品の単価設計がトークン1/10前提に書き換わること、(2)強化学習を本格運用する場合のリファレンス構成がGrace Blackwell〜Vera Rubin系に寄ること、(3)CPU選定もNVIDIA設計品が選択肢に入ることだ。Veraを直接調達できない企業も、利用クラウドのVera対応時期と価格を確認することが、来期のAI予算組みで実利のある最初の一手となる。

NVIDIA Vera CPU出荷開始｜エージェント推論コスト1/10への本文内説明図 — 図解: RLスキル生成 - 軌跡生成を使う強化学習基盤

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

Vera CPUがAnthropic・OpenAI・SpaceXAI・OCIへ出荷開始、Ian Buckが手渡し納品
エージェントサンドボックス実行が従来CPU比50%高速化を実測
Vera Rubin NVL72構成でエージェント推論のトークン単価が1/10に

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: NVIDIA
何を: Vera CPU出荷開始
いつ: 2026年5月
どこで: 米国主要AIラボ
なぜ: エージェント特化
どのように: 手渡し納品

何が起きたか

NVIDIAが自社設計初のCPU「Vera」を主要AIラボへ出荷開始し、同時にGTC Taipeiでエージェント・物理AI向けインフラを発表、Ineffable Intelligenceとの強化学習インフラ提携も公開した。

3つの視点で読む

技術 / 事業 / 規制 — この変化があなたの判断にどう効くか。

技術への影響

Veraはエージェント特有の「行動・観測・評価・更新」のタイトループ向けに設計され、サンドボックス実行が従来CPU比50%高速。Grace Blackwell/Vera Rubin NVL72と組み合わせることで、事前学習とは要件の異なる強化学習ワークロードがCPU側のボトルネックを解消する。

市場・事業への影響

Vera Rubin NVL72構成でエージェント推論のトークン単価が1/10になり、AnthropicやOpenAIが先行入手したことで、エージェント製品の価格設計の前提が動く。Jensen Huangの『放物線的』需要発言と整合し、CPU調達でもNVIDIAが選択肢の中心に入った。

規制・リスク

規制への直接影響は薄い。ただし主要AIラボがNVIDIA設計CPUにさらに集中することで、AIインフラ供給の地理的・ベンダー的集中という社会的論点が強まる構造変化が観測される。

機会と脅威

この変化で機会を得るのは誰か、脅威にさらされるのは誰か。

機会 3

NVIDIA

GPUに加え自社設計CPUまでをエージェント特化スタックとして主要AIラボに納入し、フルスタック化が進展

Anthropic / OpenAI / SpaceXAI / Oracle Cloud Infrastructure

Vera CPUを最初期に入手し、エージェント推論コストとサンドボックス速度で先行優位

Ineffable Intelligence

ステルス公開直後にNVIDIAとエンジニアリングレベルで提携し、強化学習インフラを大規模に組める立場を獲得

脅威 3

x86サーバCPUベンダー

AIラボ向けエージェントワークロードでNVIDIA設計CPUに置き換わる領域が顕在化

Vera未配備のクラウド事業者

トークン単価1/10というエージェント推論経済性の差が、調達タイミングで競争力差に直結

独自CPU/アクセラレータの新興AIインフラ勢

NVIDIAがエージェント・強化学習向けにCPUまで垂直統合したことで差別化軸が狭まる

今やるべきこと

立場別、明日から動ける一手。

技術を選ぶ人へ

Vera/Vera Rubin NVL72の入手経路と、自社が利用するクラウドでの提供時期を確認する。

事業を決める人へ

エージェント推論のトークン単価1/10という前提が、自社プロダクトの価格設計と粗利に与える影響を比較する。

手を動かす人へ

現行CPU環境でのエージェントサンドボックスの実行時間とループ回数を、Vera比較の基準値として測る。

時系列タイムライン

ステルス公開直後 David Silver創業のIneffable Intelligenceがステルスから登場
2026年5月（金曜） Vera CPUがAnthropic・OpenAI・SpaceXAIへ初出荷、Ian Buckが手渡し納品
2026年5月（月曜） Oracle Cloud InfrastructureへもVera CPUを納入
2026年5月 GTC Taipei at COMPUTEXでAIファクトリー・エージェント・物理AIの発表が集中
2026年5月 NVIDIAとIneffable Intelligenceが強化学習インフラ提携を公表（Grace Blackwellで開始、Vera Rubinで探索継続）