Blackwell、AI訓練ベンチ全7項目で首位｜前世代比1.6倍

企業動向米国メガテック MLPerf Training 6.0 06/17 03:05

AI TREND

NVIDIA：訓練ベンチ全7項目首位

NVIDIAは、AI訓練の性能を測る業界標準ベンチマーク「MLPerf Training 6.0」で、自社のBlackwell基盤が全7項目で最速の訓練時間を記録したと発表した。最大8,192基のGPUを用いた構成で全項目に結果を提出した唯一の基盤となった。

3 の要点を3分で

NVIDIAは、AI訓練の性能を測る業界標準ベンチマークMLPerf Training 6.0で、自社のBlackwell基盤が全7項目で最速の訓練時間を記録したと発表した。最大8,192基のGPUを用いた大規模構成にも対応し、全項目に結果を提出した唯一の基盤となった。

今回の核心は、新世代の大型システムGB300 NVL72が同一規模の前世代GB200 NVL72比で最大1.6倍速い訓練性能を達成したことだ。世代更新の効果が具体的な数値で示された。さらに、役割を分けて処理する新方式である混合エキスパート(MoE)の事前学習タスクとしてDeepSeek-V3 671Bなどが追加され、Blackwell基盤はこれで8,192基まで拡張し過去最大規模を提出した。

クラウド事業者の記録も具体的で、CoreWeaveはDeepSeek-V3 671Bを2.02分、Microsoft AzureはLlama 3.1 405Bを7.07分で訓練した。ASUS・Dell・Google Cloud・Fujitsuなど19組織がエコシステムとして結果を提出している。訓練の速さは最先端モデルの投入時期と訓練コストに直結し、世代選定の判断材料となる。

Blackwell、AI訓練ベンチ全7項目で首位｜前世代比1.6倍の本文内説明図 — 図解: 訓練ベンチ全7項目首位 - NVIDIAはAI訓練の性能を測る業界標準ベンチマークMLPerf

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

Blackwell基盤がMLPerf Training 6.0の全7項目で最速を記録
新世代GB300 NVL72が同一規模の前世代比で最大1.6倍速い
DeepSeek-V3 671Bで8,192基まで拡張し過去最大規模を提出

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: NVIDIA
何を: 訓練ベンチ全7項目首位
いつ: 2026年6月17日
どこで: MLPerf Training 6.0
なぜ: 世代更新で訓練高速化
どのように: Blackwell基盤で提出

背景

AIモデルの開発はすべて「訓練（モデルを学習させる工程）」から始まり、その基盤の性能が開発速度・モデル規模・完遂の信頼性を左右する。MLPerf Trainingは、第三者の査読を経た厳格な業界ベンチマークで、各社のAI訓練性能を共通の物差しで比較する仕組みである。今回の6.0では、専門家ごとに役割を分けて処理する新方式（混合エキスパート、MoE）の事前学習タスクとして「DeepSeek-V3 671B」「GPT-OSS-20B」が新たに追加された。NVIDIAはGB200 NVL72とGB300 NVL72という、ラック単位でまとまった大型システムで結果を提出した。

なぜ今注目なのか

モデルが大型化・複雑化するほど、訓練基盤に求められる速度・規模・信頼性は上がり続けている。NVIDIAは全項目で最速を示しただけでなく、同一規模でGB300 NVL72が前世代GB200 NVL72より最大1.6倍速いことを示し、世代更新の効果を具体的な数値で示した。訓練の速さは、開発企業が最先端モデルをより早く投入し、訓練費用を抑えて早期に収益化できるかに直結する判断材料となる。

全7項目で最速、唯一の全項目提出基盤

NVIDIAのBlackwell基盤が、AI訓練の性能を測る業界標準ベンチマーク「MLPerf Training 6.0」の全7項目で最速の訓練時間を記録した。最大8,192基のGPUを用いた大規模構成にも対応し、全項目に結果を提出した唯一の基盤となった。

Every breakthrough AI model starts the same way: with a training run. The infrastructure running those training jobs shapes everything: how fast teams can iterate, what scale of model they can build and whether those jobs complete reliably.
出典: NVIDIA Blog

ここでNVIDIAが言うのは、あらゆる先端AIモデルの開発は「訓練(モデルを学習させる工程)」から始まり、その基盤が開発速度・作れるモデルの規模・ジョブが信頼性高く完遂するかを左右する、という点だ。MLPerf Trainingは第三者の査読を経た厳格な業界ベンチマークで、各社のAI訓練性能を共通の物差しで比較する仕組みである。

前世代比1.6倍、世代更新の効果が数値化された

今回の核心は、新世代の大型システムGB300 NVL72が、同一規模の前世代GB200 NVL72より最大1.6倍速い訓練性能を達成したことだ。GB300 NVL72・GB200 NVL72はいずれもラック単位でまとまった大型システムで、NVIDIAはこの両方で結果を提出した。

この「同一規模で1.6倍」という比較は、世代更新でどれだけ速くなるかを具体的な数値で示している。訓練時間が短くなれば、開発企業は最先端モデルをより早く投入でき、訓練費用を抑えて早期に収益化に近づける。世代をまたいで構成を選ぶ運用者にとって、投資対効果を測る直接の材料になる。

DeepSeek-V3 671Bを2.02分、Llama 405Bを7.07分

MLPerf Training 6.0では、役割を分けて専門家ごとに処理する新方式である混合エキスパート(MoE)の事前学習タスクとして「DeepSeek-V3 671B」「GPT-OSS-20B」が新たに追加された。Blackwell基盤はこのDeepSeek-V3 671Bで8,192基のGPUまで拡張し、Blackwell基盤として過去最大規模の結果を提出した。

クラウド事業者の記録も具体的だ。

CoreWeave: DeepSeek-V3 671Bを8,192基規模・GB300 NVL72構成で訓練し、2.02分という最速時間を達成した
Microsoft Azure: Llama 3.1 405Bの訓練を8,192基のGPUで7.07分まで短縮し最速を記録した

これらは大規模訓練をクラウド経由で借りたい企業にとって、どの事業者・どの構成を選ぶかの基準値になる。

19組織が結果を提出、誰が次の一手を打つか

今回はNVIDIA単独ではなく、ASUS・Dell・Google Cloud・Fujitsuなど19組織がエコシステムとして結果を提出した。査読を経た共通の物差しで世代差が数値化されたことが、この発表の実用上の意味だ。

NVIDIAは全項目首位で標準的な選択肢としての位置を補強した。CoreWeaveやMicrosoft Azureは最速記録を提出し、大規模訓練を借りたい企業への訴求材料を得た。一方、前世代GB200 NVL72に投資を固定した運用者は、同一規模で最大1.6倍という差を前に世代更新の判断材料が増えた。

国内で大規模モデルを訓練・借用する事業者は、自社が重視するタスクが大型MoE系か405B規模かを定義したうえで、公式ベンチの該当項目と自社構成の対応を確認すると、世代選定の根拠を持てる。