AWS:偽装連絡先検出手法公開
画像: AI生成

AWSが公開した今回の手法は、BtoB仲介プラットフォームにおける「プラットフォーム外取引」という古くからの収益課題に、生成AIを当てる実装例である。買い手と売り手がメッセージ機能を通じて電話番号やメールアドレスを交換し、仲介手数料を回避する行為は、手数料収入の損失だけでなく、サービス価値の低下、パートナー関係の毀損、業界内ポジションの低下という連鎖的な悪影響を招くとブログ内で明示されている。

技術的な核は、正規表現とLLMの役割分担にある。電話番号やメールの「構造化パターン」は正規表現が得意とする領域だが、絵文字での桁置換、リートスピーク(文字を数字や記号に置き換える表記)、寸法情報を装った数字列といった動的な偽装には対応できない。ここにNova Lite 2を置き、文脈理解とセンチメント分析を含めて判定させる構成が示された。

実装面で参考になるのは、Amazon Bedrockプレイグラウンドでの推論パラメータが具体的に提示されている点である。レスポンス長1,000トークン、低温度設定で一貫した出力を得るという指針は、そのままPoCの初期値として使える。また、配送寸法のような正規の数値情報を除外するようプロンプトで指示できるため、マーケットプレイスの業務知識を検出ロジックに織り込みやすい。

読者が着手時に注意すべきは、誤検出時の運用である。自動遮断にするか、人手レビューを挟むかの設計を先に決めなければ、正当な商談メッセージをブロックしてユーザー体験を損なう。PIIを扱う以上、ログ保持期間と閲覧権限の境界も初期設計で定義しておく必要がある。