AWSが、複数の顧客に同一のAIエージェント基盤を提供しながら各顧客のデータを完全に分離する「プール型」マルチテナント設計を、Amazon Bedrock AgentCoreを使った構成として公式ブログで解説した。複数のクリニックや病院に医療AIアシスタントを提供する例で示している。
分離の核は認証設計にある。Amazon Cognitoが発行するトークンに顧客の階層・所属組織・役割を埋め込み、各処理がそのテナント範囲だけを操作する。加えて各エージェントセッションを隔離された小型仮想マシン(micro-VM)で実行し、計算資源レベルでも分離する。サービス階層ごとにモデルも変え、簡易階層は軽量モデル(Mistral Ministral 3 8B)、上位階層は高度な推論モデル(OpenAI GPT OSS 120B)とWeb検索機能を割り当てる。
コスト配分タグにより階層ごとの費用追跡が可能で、データ分離・品質階層・費用按分という外販の必須要件が1つのパターンで揃う。医療を例にしているが、企業内の部門別利用や受託サービスにも応用できる汎用パターンで、サンプル実装コードもGitHubで公開された。本記事はマルチテナント設計シリーズの第2回。