NVIDIA:MRCをSpectrum-Xに搭載
画像: AI生成

NVIDIAは2026年5月6日、AI学習向けEthernetファブリックSpectrum-Xに、新機能MRC(Multipath Reliable Connection)を加えたと発表した。MRCは単一のRDMA接続を複数のネットワークパスに分散してトラフィックを流し、輻輳が発生した場合でも高い実効帯域を維持する仕組みである。さらにFailure Bypassと呼ばれる機能で、リンク障害の検出と迂回をハードウェア内でマイクロ秒単位に完結させる。上位のNCCL等の集合通信ライブラリから見ると中断が観測されにくく、大規模な学習ジョブのテールレイテンシとチェックポイント戦略の前提が変わる。

実装面では、OpenAIがBlackwell世代クラスターでMRCを本番導入し、ネットワーク起因の遅延と中断を大幅に削減したと報告している。Microsoft FairwaterやOracle Abileneなど世界最大級のAIデータセンターでもSpectrum-Xが採用されており、ギガスケール環境での実証が先行している。

重要なのは、MRCがOpen Compute Project(OCP)を通じてオープン仕様として公開された点である。開発にはNVIDIAだけでなくAMD、Broadcom、Intel、Microsoft、OpenAIが参加しており、今後はNVIDIA以外のNIC・スイッチベンダーも同方式を実装できる。これはAIファブリックの標準化を一段進める動きで、InfiniBand一択だったフロンティア学習環境でEthernet採用の根拠が厚くなる。

日本のAI DC投資・調達を担う立場では、ファブリック層のKPI設計に直接影響する。調達RFPで「学習中断時間」「輻輳時の実効帯域」「障害迂回の粒度」を明文化し、Spectrum-Xの公開事例を比較の基準点として記録しておくと、次期クラスター設計の判断を早められる。