文書抽出の精度調整を数週間から数分へ｜AWS新機能

AI TREND

AWS：抽出指示の自動改善

AWSが、文書から構造化データを取り出すAmazon Bedrock Data Automationに、抽出指示文を自動で改善する「ブループリント指示最適化」機能を追加した。見本文書と正解値を渡すと、各項目の自然言語の指示文を数分で調整し、抽出精度を高める。

3 の要点を3分で

AWSが文書から構造化データを取り出すAmazon Bedrock Data Automationに、抽出指示文を自動改善する「ブループリント指示最適化」機能を追加した。利用者が見本文書3〜10件と正解値を渡すと、各項目の自然言語の指示文を数分で調整する。モデルの再学習(ファインチューニング)は不要である。

従来は、取引先ごとの様式の違いやスキャン品質の低下で抽出精度が落ち、指示文を人手で何度も書き換える必要があった。文書種別によっては調整に数週間かかることもあった。今回の機能はこの試行錯誤を1つの自動処理に置き換える。改善度はF1スコアと完全一致率で確認でき、発注書(購買注文)の例では全体一致率が90%から92%へ向上した。項目の型や推論種別は変わらず、指示文だけが洗練される。

Amazon BedrockのコンソールまたはAPIから利用でき、対応リージョンでの有効化が前提となる。大量処理の現場では数ポイントの精度向上でも、人手による確認待ちの削減と処理速度の向上に直結する。

文書抽出の精度調整を数週間から数分へ｜AWS新機能の本文内説明図 — 図解: 抽出指示の自動改善 - AWSが文書から構造化データを取り出すAmazonBedrock

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

手作業で数週間かかった指示文調整を数分の自動処理に置き換える
見本文書3〜10件と正解値を渡すだけ、モデルの再学習は不要
発注書の例で全体一致率が90%→92%に向上、F1スコアでも確認可能

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: AWS
何を: 抽出指示の自動改善
いつ: 2026年6月12日報
どこで: Amazon Bedrock
なぜ: 指示調整の工数削減
どのように: 見本と正解値で最適化

背景

請求書や契約書、税務書類などの非定型文書から決まった項目を取り出す自動化は、多くの企業の共通課題である。Bedrock Data Automationでは、抽出したい項目とその説明文（指示）をまとめた設計図（ブループリント）を作り、単一の窓口（API）で分類・抽出・正規化・検証を行える。しかし、取引先ごとに様式が異なったり、スキャン品質が悪かったりすると精度が落ち、従来は指示文を手作業で何度も書き換えて調整する必要があった。文書種別ごとに数週間かかる場合もあった。

なぜ今注目なのか

今回の機能は、手作業の試行錯誤を1つの自動処理に置き換え、数週間かかっていた指示文の調整を数分に短縮する点が要である。記事の発注書（購買注文）の例では、項目が完全一致した割合（全体）が最適化前90%から92%へ改善した。大量処理の現場では数ポイントの精度向上でも、人手による確認待ちの削減と処理速度の向上に直結する。

指示文の手調整が数分の自動処理になった

AWSが、文書から構造化データを取り出すサービス「Amazon Bedrock Data Automation」に、抽出指示文を自動で改善する「ブループリント指示最適化」を追加した。利用者が見本文書3〜10件と、そこから取り出すべき正解値を渡すと、システムが各項目の抽出指示文を数分で調整する。モデルの再学習(ファインチューニング)は不要である。

You provide three to ten example documents with expected values, and BDA refines your blueprint instructions to improve accuracy in minutes, not weeks. No separate model fine-tuning is required.
出典: AWS Machine Learning Blog

引用にある通り、見本文書と期待値(正解値)を渡せば、数週間ではなく数分で指示文が洗練され、別途のモデル学習は要らない。ここで調整されるのは項目の型や推論の種別ではなく、各項目に添える自然言語の指示文だけである。

なぜ指示文の調整が課題だったのか

請求書や契約書、税務書類のような非定型文書から決まった項目を取り出す自動化は、多くの企業に共通する課題である。Bedrock Data Automationでは、取り出したい項目とその説明文(指示)をまとめた設計図「ブループリント」を作り、単一の窓口(API)で分類・抽出・正規化・検証をまとめて行える。

ところが、取引先ごとに様式が違ったり、スキャン品質が悪かったりすると抽出精度が落ちる。これまでは精度を上げるために、項目ごとの指示文を人手で何度も書き換えて試す必要があり、文書種別によっては調整に数週間かかることもあった。今回の最適化は、この試行錯誤を1つの自動処理に集約し、見本と正解値から指示文を機械的に磨き込む点が要である。

改善度はどう測れるか

最適化の効果は、抽出結果と正解値を突き合わせる2つの指標で確認できる。1つはF1スコア(取りこぼしと誤りのバランスを見る精度指標)、もう1つは完全一致率(項目の値が正解とぴったり一致した割合)である。

発注書(購買注文)の例: 全体の完全一致率が最適化前の90%から92%へ向上した。
変わらないもの: 項目の型や推論の種別は変更されず、自然言語の指示文だけが洗練される。
適用方法: Amazon Bedrockのコンソール、またはAPIから最適化ワークフローを実行でき、対応リージョンで機能を有効化しておくことが前提となる。

2ポイントという数字は小さく見えるが、大量の文書を流す現場では、誤抽出による人手の確認待ちが減り、処理全体の速度向上に直結する。導入是非を判断するなら、自社の文書種別で同じ指標を取り、調整前後の差を測るのが具体的な一手になる。

自社で入れるべきかの判断材料

取引先ごとに様式の異なる請求書や発注書を大量に処理している国内事業者は、指示文の手調整に割いていた工数を数分の自動処理に置き換えられる。再学習が不要なため、既存のブループリント運用にそのまま重ねられるのも導入の障壁を下げる。

一方で、指示文を数週間かけて手で書き込んできた作り込み型の運用は、その工数で得ていた優位が薄れる。コストやROIの公開数値は今回示されていないため、投資判断は「人手確認に費やしている時間」と「誤抽出による差し戻し件数」を自社で測り、2ポイント程度の精度改善がそれらをどれだけ減らすかで見積もるのが現実的である。