AWSは2026年6月19日、文章を意味ベクトルに変換する軽量モデルall-MiniLM-L12-v2を、機械学習基盤Amazon SageMaker JumpStartで利用可能にしたと発表した。このモデルはオープンソース系のSentence Transformersが提供するもので、文章や段落を384次元の密ベクトルに変換する。

用途は意味検索、文書のグループ分け(クラスタリング)、重複検出、言い換え判定など。コンパクトな構造で推論が速く、大量の文章を扱う本番運用に向くとされる。展開はSageMaker StudioのModelsセクションから数クリック、またはPython SDKから自社AWSアカウントへ行える。埋め込み処理を外部に出さず自社環境内で完結できる点が実務的に大きい。

今回の追加は単発ではなく、AWSは2026年4月に多言語版paraphrase-multilingual-MiniLM-L12-v2を提供しており、意味検索や検索拡張生成(RAG)の土台となる埋め込みモデルの拡充が続いている。日本語を含む多言語なら4月の多言語版、英語中心なら今回のモデル、と用途で使い分けられる。