2層アーキテクチャが解く問題
AWS の Sales, Marketing and Global Services (SMGS) 部門が公開した NarrateAI は、社内のビジネスインテリジェンスを対話形式で提供する内製 AI アシスタントだ。設計の中心は、バッチ処理層とリアルタイム対話層を明確に分離した2層アーキテクチャにある。
対話型 BI を素朴に作ると、ユーザの質問が来るたびに大量データを集計し LLM で要約する構成になり、応答遅延と精度のトレードオフに苦しむ。NarrateAI は重い分析処理をバッチ側に寄せ、対話層は事前処理済みの結果に対する軽量な応答に専念する形でこの問題を回避している。
専門エージェントの分業設計
もう一つの鍵は、ルーティング用と検証用の専門エージェントを分けている点だ。AWS 公式ブログは次のように説明する。
the specialized AI agents that power intelligent routing and validation, key engineering patterns for production deployment
ルーティング担当が質問を適切な処理パスに振り分け、検証担当が出力の妥当性をチェックする。単一エージェントに全責務を載せる設計と比べ、各層の評価・改善を独立して回せる利点がある。
実装着手時の落とし穴
本家ブログには書かれていないが、この種の2層構成を自社で再現する際にハマりやすいのが、バッチ層と対話層のデータ鮮度の同期だ。バッチが夜間更新なら、対話層は「いつ時点のデータか」をユーザに明示する設計が要る。鮮度の取り違えは BI の信頼を一瞬で崩す。AgentCore で組む際は、応答に必ずデータ基準時刻を埋め込むテンプレートを設計段階で固定しておきたい。