米大手のHuntington銀行が、社内に蓄積した4億件以上の文書から個人情報(PII)と決済カード情報(PCI)を見つけて黒塗りする作業を、AWSのクラウドサービスで自動化した事例をAWSが公開した。当初は数年かかると見積もられていた処理が数か月に短縮され、費用は当初見積もりの約5%に収まり、黒塗り精度は95%以上に達した。

処理の中核は、文書の文字を読み取るAmazon Textractと、処理を順序立てて動かすAWS Step Functionsである。この組み合わせで1日約1000万件のペースを実現した。オンプレミスとクラウド間のデータ移動はAWS DataSyncと専用線のDirect Connectで暗号化して行い、保管中も通信中も暗号化したうえでPCI DSSを満たした。

流行の生成AIを主役にせず、既存のAIサービスを束ねて規制水準の品質を出した点が特徴で、同じ課題を抱える企業が設計の出発点として参照できる。Huntingtonは今後、M&Aなど大量黒塗りが必要な場面にも同じ枠組みを転用する方針を示している。