ID抽出を90.8%に｜Sun FinanceのAWS生成AI設計

AI TREND

Sun Finance：ID抽出と不正検知を自動化

Sun FinanceがAmazon Bedrock、Textract、Rekognitionを組み合わせた本人確認と不正検知のパイプラインを本番稼働させ、抽出精度・処理速度・コストで定量的な改善を達成した事例がAWSブログで公開された。

3 の要点を3分で

Sun FinanceがAWS Machine Learning Blogで公開した本人確認パイプラインの事例は、生成AIを規制産業の基幹業務に適用する際の設計指針として注目度が高い。

最大のポイントは、同一データでのLLM単体（Claude Sonnet 4で61.8%）と、Amazon Textractによる専用OCRをフロントに置きBedrock上のLLMで構造化する多層構成（90.8%）の精度比較が公開されたことだ。既存の79.7%という基準値も上回り、LLMだけ、OCRだけでは到達できない水準を組み合わせで実現したことが明示されている。

運用面の数字も具体的だ。1件あたりの処理コストは91%削減、処理時間は最大20時間から5秒未満に短縮された。月間8万件のマイクロローン申請のうち約10%が実際の不正申請という規模で回っているため、これは実験値ではなく本番負荷での結果である。PoC開始から本番稼働まで107営業日、Sun Finance側の実装工数は35営業日という導入期間も公開されている。

不正検知側は、Amazon Rekognitionで顔をマスキングしたうえでTitan Multimodal Embeddingsで画像をベクトル化し、Amazon S3 Vectorsで類似検索するサーバーレス構成を採用した。類似背景を使い回す不正申請パターンに対して、生体情報そのものを保持せずに検出する実装パターンを提示している。

日本の金融・保険・行政の本人確認業務にとって、この事例は「どの工程をどのマネージドサービスに割り当てれば、精度・コスト・処理時間がどの水準まで動くか」を具体的数字で比較できる参照点になる。

ID抽出を90.8%に｜Sun FinanceのAWS生成AI設計の本文内説明図 — 図解: 二層AI設計 - OCR＋LLMの多層構成がLLM単体を29ポイント上回る

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

OCRとLLMの組み合わせで抽出精度79.7%→90.8%、LLM単体は61.8%どまり
1件あたり処理コスト91%削減、処理時間は最大20時間から5秒未満に短縮
S3 Vectorsで顔マスキング済み画像のベクトル類似検索を行い不正申請を検知

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: Sun Finance
何を: ID抽出と不正検知を自動化
いつ: 2026年5月1日公開
どこで: AWS上
なぜ: 精度と処理時間の改善
どのように: OCRとLLMの多層構成

何が起きたか

Sun FinanceがAmazon Bedrock、Textract、Rekognitionを組み合わせた本人確認と不正検知のパイプラインを本番稼働させ、抽出精度・処理速度・コストで定量的な改善を達成した事例がAWSブログで公開された。

背景

この変化を理解するための前提。

Sun Financeは2017年創業で9カ国に展開するオンライン融資マーケットプレイスであり、月間400万件以上の審査を処理している。同社は2019年にAmazon RekognitionとTextractを用いた最初のIDV自動化を構築したが、新興地域への展開に伴い、現地語がOCR学習データに少ないことや7種類の異なるID書類フォーマットへの対応が課題となった。マイクロローンの月間8万件の申請のうち約60%が手動レビューを必要とし、そのうち80%はOCRエラーに起因するものだった。また1日の申請の約10%が実際の不正申請であり、類似画像を使った詐欺パターンの検出に多大な人的工数がかかっていた。

なぜ今注目なのか

本事例は、LLM単体（精度61.8%）でも専用OCR単体でもなく、OCRとLLMを組み合わせたマルチティア設計が最高精度（90.8%）を実現したことを定量的に示しており、金融・保険・行政など本人確認が必要な業界のAI導入設計に直接応用できる知見を提供している。さらにAmazon S3 Vectorsを用いたベクトル類似検索による不正検知という比較的新しいアーキテクチャパターンが実運用レベルで検証されており、サーバーレス構成での不正対策設計の参考事例として注目度が高い。

3つの視点で読む

技術 / 事業 / 規制 — この変化があなたの判断にどう効くか。

技術への影響

LLM単体61.8%、マルチティア設計90.8%という同一データでの比較が公開された。専用OCR（Textract）で構造を抽出し、LLM（Bedrock上のClaude Sonnet 4）で意味的に整形する二層構成が、単体LLMを29ポイント上回る事実が示され、IDV系ワークロードの設計基準が動いた。

市場・事業への影響

処理時間が最大20時間から5秒未満、単価91%削減という数字は、本人確認をオフライン後処理から申込フローのリアルタイム判定に移す経済合理性を示す。月間8万件・不正率10%という規模で回っているため、マイクロファイナンスや消費者金融の既存BPO依存モデルに直接の比較対象ができた。

規制・リスク

顔画像をRekognitionでマスキングしたうえでTitan Multimodal Embeddingsのベクトルに変換してS3 Vectorsに格納する構成は、生体情報そのものを保持せず類似検索する実装パターンを公的に提示した。本人確認義務のある金融・行政領域で、個人情報保護と不正検知を両立させる設計の参照先になる。

機会と脅威

この変化で機会を得るのは誰か、脅威にさらされるのは誰か。

機会 3

AWS（Bedrock / Textract / Rekognition / S3 Vectors）

本人確認という規制産業のワークロードで定量成果が出たリファレンス事例を獲得した

マイクロファイナンス・消費者金融事業者

107営業日で本番化、単価91%減という具体的な導入パスと経済効果が提示された

Anthropic（Claude Sonnet 4）

Bedrock経由でIDV本番パイプラインに組み込まれた実績が公開された

脅威 3

汎用LLM単体での本人確認を売り込むベンダー

LLM単体61.8%に対しOCR併用90.8%という比較数値が公開され、単体構成の不利が明示された

手作業ID確認を前提としたBPO・審査代行

20時間から5秒未満、単価91%減の数字が出たことで工程の自動化圧力が強まる

類似画像による不正申請グループ

背景画像パターンのベクトル照合で類似申請が自動検出される運用が確立した

今やるべきこと

立場別、明日から動ける一手。

技術を選ぶ人へ

AWSブログ原文でTextract→Bedrockの受け渡しスキーマ、S3 Vectorsのインデックス構成、顔マスキング前後のデータ保持ポリシーを確認する。

事業を決める人へ

自社の本人確認フローで「抽出精度」「1件あたりコスト」「処理時間」「不正検知率」の現状値を測定し、90.8% / 5秒未満 / 91%減を比較基準として定義する。

手を動かす人へ

手元のID画像サンプルでLLM単体抽出とTextract+LLM構成の精度を比較し、61.8%と90.8%の差分が自社データでも再現するか切り分ける。

時系列タイムライン

PoC開始 Sun FinanceがAWS上で本人確認パイプラインのPoCを6週間の想定で開始
実装期間 Sun Finance側の実装に35営業日を投入、PoCから本番までトータル107営業日
2026年5月1日 AWS Machine Learning Blogで事例公開。抽出精度79.7%→90.8%、処理時間20時間→5秒未満、単価91%減を報告