「AIファクトリー」という再定義が意味するもの
NVIDIAは公式ブログで、AIインフラを「トークンを生み出す工場(token factories)」と位置づけ、電力をリアルタイムでインテリジェンス(推論結果)に変換する設備だと定義した。重要なのは、これが単なるマーケティング用語ではなく、評価指標の置き換えを伴っている点である。同社は「performance per watt(ワットあたり性能)」と「cost per token(トークンあたりコスト)」を、これからの事業経済を決める指標として明示した。
AI factories are token factories, converting power into intelligence in real time. And as agentic AI scales and autonomous, always-on special agents are deployed in the enterprise, performance per watt and cost per token become the economics that matter.
なぜ「電力 → トークン」の変換工場なのか
背景にあるのは、エージェント型AIの常時稼働化である。チャットボットのように人間の入力を待つ間欠的なワークロードから、自律的に動き続けるエージェントが企業内に常駐するワークロードへと比重が移る。これは推論需要がピーク型から連続型に変わることを意味し、設計制約が「最大性能」から「持続的な単位電力あたり生産性」に切り替わる。データセンターの本質が、計算機の集積から「電力を商品(トークン)に変換する生産設備」へと近づく。
日本の調達現場に効く論点
日本のAI活用責任者にとって、この再定義は調達の意思決定単位を変える。これまでの「GPUを何枚買うか/クラウドで何インスタンス借りるか」という議論は、「単位電力からどれだけのトークンを生み出せるか」「自社サービスの$/tokenはいくらか」という単位経済性の議論に置き換わる。電力単価が相対的に高い日本では、立地・電力契約・冷却効率がそのまま粗利率を左右することになる。社内のAI予算を、サーバー調達費ではなくトークン生産原価として再計上できるかが、次の半年で問われる論点になる。