NVIDIAは2026年5月16日、公式ブログ「RTX AI Garage」シリーズでNous ResearchのオープンウェイトモデルHermes 4を取り上げ、RTX搭載PCおよびDGX Spark上で「自己改善型AIエージェント」を構築する構成を公開した。
ポイントは、推論モデル・エージェントの実行・合成データ生成・微調整までを、クラウドに送らずローカルGPUで一気通貫に回せる点にある。エージェントが実行ログから学習用データを生成し、それを使ってモデルを段階的に改善するというループは、これまでクラウドAPIと外部GPU基盤を組み合わせる構成が主流だった。Hermes 4がオープンウェイトで提供されること、そしてNVIDIAがRTX/DGX Sparkでの動作を公式に位置付けたことで、手元の1台で完結させる選択肢が現実味を帯びた。
日本の開発現場にとっての意味は二つある。一つは、社内データや顧客データを外部に出せない業界(金融・医療・製造)で、エージェント開発のPoCをローカルで回せる構成が増えること。もう一つは、DGX Sparkという比較的新しいハードの具体的な活用事例として、抽象的な「AI開発用途」ではなく「自己改善エージェント基盤」というユースケースが提示されたことだ。
一方で、ハードの初期投資、Hermes 4のライセンス条件、商用利用時のサポート体制など、本ブログだけでは判断しきれない要素もある。クラウドAPI利用との総コスト比較、社内ユースケースでの精度検証、運用工数の見積もりは個別に詰める必要がある。