AWSの生成AI支援チームが航空写真大手Vexcelと組み、膨大な航空写真を自然言語で検索する仕組みをAmazon BedrockとAmazon OpenSearch Serverless上で構築した。従来は探したい物体ごとに専用の画像認識モデルを学習させ、教師データ作成と再学習を繰り返す必要があったが、画像を多モーダル埋め込みで一度索引化すれば再学習なしで自然言語クエリを検索に変えられる。
中核には2025年10月28日にAmazon Bedrock上で公開されたAmazon Nova Multimodal Embeddingsが使われた。埋め込みモデル・統合手法・検索方式を比べる検証で、Amazon Nova・Amazon Titan・Cohere Embed v4を同条件で比較し、Novaが両ベンチマーククエリで最高のF1スコアを記録した。
航空写真の1区画は正射画像・斜め4方向・高さモデル(DSM/DTM)の7視点で構成される。正解ラベルが無いためOpenStreetMapを自動的な正解基準に使った。この成果は検索可能な画像製品Vexcel Intelligence(プレビュー提供中)へ発展し、保険・不動産・行政・インフラ・農業など地理空間データを扱う業界に応用が効く。