何が変わったのか
AWSが次世代のAmazon OpenSearch Serverlessを一般提供開始した。AIエージェントを構築する顧客向けに設計された、フルマネージドの検索・ベクトルエンジンである。
the next generation of Amazon OpenSearch Serverless, a fully managed search and vector engine designed for customers building agents. The next generation of OpenSearch Serverless auto scales 20x faster than its predecessor and provisions resources in seconds
— AWS What's New
中核は、新しい共有ストレージ層を通じたコンピュートとストレージの完全分離だ。これにより低トラフィック時にはコンピュートを独立して縮小してコストを抑え、トラフィックスパイク時には即座に対応できる。scale-to-zeroと従量課金(pay-per-usage)により、ピーク負荷向けにOpenSearchクラスタをプロビジョニングする場合と比べ最大60%のコスト削減を可能にするとしている。
エージェント開発スタックへの組み込み
注目すべきは開発体験の統合だ。次世代OpenSearch ServerlessはVercelやKiroといったAI開発プラットフォームとネイティブ統合し、開発環境から自然言語コマンドで検索インフラを直接プロビジョニングできる。
さらにOpenSearch Agent Skillsの一部となり、Claude Code・Cursor・Codexといったコーディングプラットフォームを使う際にOpenSearchの機能をエージェントに持ち込める。ネットワーク接続性の面では、コレクションレベルエンドポイントとリージョナルエンドポイントの2種のリソースベースエンドポイントを提供し、標準VPC APIでマルチVPCやオンプレミス接続を簡素化する。
導入判断の論点
GA時点で利用できるコレクションタイプは検索(search)とベクトル(vector)の2種。提供範囲はAmazon OpenSearch Serverlessが現在利用可能な全商用AWSリージョンである。
実装着手時の落とし穴として、最大60%削減という数値は「ピーク向けに常時クラスタを確保する構成」との比較である点に注意したい。常時高負荷のワークロードでは前提が異なる。自社のトラフィックパターンがどれだけ変動するか、scale-to-zeroの恩恵を受けられるかを測ったうえで現行構成と単価を比較することが判断の起点になる。