半導体新興のCerebrasは、AWSと複数年の提携を結び、自社のウェーハスケールチップCS-3とAWS独自設計のAI向けチップTrainiumを1か所に並べて使う分散型の推論システムを構築すると公表した。このシステムはAWSの生成AI基盤Amazon Bedrock経由で利用できる。
Cerebrasは2026年6月11日のX投稿で、NVIDIAが推論特化チップ企業Groqを約200億ドルで取得した動きと自社のAWS提携を「同じ目的」と並べ、推論処理を機能ごとに分業する分散推論(disaggregated inference)が次のAIインフラの主流だと主張した。
大規模言語モデルの推論は、入力文を読み込む段階と回答を1語ずつ生成する段階で必要な計算特性が異なる。従来は同じGPUが両方を担っていたが、機能ごとに専用ハードへ割り当てる設計が大手2陣営で同時に進む。AWS利用者にとっては、Bedrock経由で従来と異なる推論基盤を選べる選択肢が増える点が実務的に効く。なお、NVIDIA-Groq取引については米上院のWarren、Blumenthal両議員が独占禁止法回避の懸念を問う書簡を出している。
NVIDIA paid $20B for Groq. AWS partnered with Cerebras for the same purpose. A quick breakdown of why disaggregated inference is the next thing in AI infrastructure.
We are actively working to bring it online -- in the US, private (not selling your data and not retaining your data), and running on the latest NVIDIA GPUs.