AWSが文書から構造化データを取り出すAmazon Bedrock Data Automationに、抽出指示文を自動改善する「ブループリント指示最適化」機能を追加した。利用者が見本文書3〜10件と正解値を渡すと、各項目の自然言語の指示文を数分で調整する。モデルの再学習(ファインチューニング)は不要である。
従来は、取引先ごとの様式の違いやスキャン品質の低下で抽出精度が落ち、指示文を人手で何度も書き換える必要があった。文書種別によっては調整に数週間かかることもあった。今回の機能はこの試行錯誤を1つの自動処理に置き換える。改善度はF1スコアと完全一致率で確認でき、発注書(購買注文)の例では全体一致率が90%から92%へ向上した。項目の型や推論種別は変わらず、指示文だけが洗練される。
Amazon BedrockのコンソールまたはAPIから利用でき、対応リージョンでの有効化が前提となる。大量処理の現場では数ポイントの精度向上でも、人手による確認待ちの削減と処理速度の向上に直結する。