何が刷新されたか
AWSは次世代のAWS Resilience Hubの一般提供(GA)を発表した。Resilience Hubは、AWS上で動く重要ワークロードの耐障害性を評価・強化するためのAWSコンソール内の中央拠点であり、プラットフォームエンジニアリングチームとSREチームが対象だ。
introducing a new application model, dependency discovery, generative AI-powered failure mode analysis, modular resilience policies, and organization-wide reporting
新版では、アプリケーションをシステム / ユーザージャーニー / サービスの3階層でモデル化し、アプリがどうビジネス価値を届けるかを反映させる。依存関係発見アセスメントを通じて、サービスが依存するAWSサービス・内部エンドポイント・サードパーティエンドポイントの可視性を最新に保つ。
生成AIと組織横断ガバナンス
中核は生成AIによる障害モード診断だ。サービスをAWS Well-Architectedベストプラクティス、AWS Resilience Analysis Framework、組織の耐障害性ポリシーの3基準で分析し、優先度付きで実行可能な推奨を生成する。これまで手作業に依存しがちだった耐障害性の棚卸しと改善提案が、コンソール内で自動化される。
さらにAWS Organizations連携により、中央チームが耐障害性ポリシーを定義し、全アカウント・全リージョンのポスチャを単一ダッシュボードで監視できる。大規模なマルチアカウント環境を持つ組織にとって、ガバナンスの集約点が増える。
移行とリージョン
次世代版はResilience Hubが提供される全AWSリージョンで利用できる。既存ユーザーは現行体験を継続利用でき、自分のペースで次世代版を採用できる。移行に際してはmigration user guideが用意されている。導入着手時の落とし穴として、サードパーティエンドポイントの依存関係が依存関係発見で正しく拾えるかは事前検証が要る点が挙げられる。コストやROIに関する公開数値は本発表に含まれていないため、まずは1アプリで効果を測る運用が現実的だ。