決済大手Stripeが、AWSのAmazon Bedrockを使って金融犯罪対策の審査を支援する本番稼働のAIエージェントを構築した事例をAWSが公開した。審査の処理時間を26%削減しつつ、最終判断は人間の専門家が維持し、回答の有用性評価は96%超を達成している。
設計の核は、推論と行動を繰り返すReAct方式を採り、複雑な審査を依存関係を持つ小さな下位タスクへ分解して有向非巡回グラフ(DAG)として構成した点にある。ツール実行の結果を必ず観測として処理させることで、AIの作り話(hallucination)や推論のずれを抑える閉ループ制御を実現した。さらにプロンプトのキャッシュ活用などでコストを最適化している。
Stripeは50カ国で年間約1.4兆ドルの決済を扱う規模で、AIエージェントの回答を最終判断ではなく人間への補足情報として渡す設計を採用した。説明責任が問われる金融分野で、効率化と監査可能性を両立させたい企業にとっての参照アーキテクチャになる。
Gemini 3.5 Flash now supports native computer use. This built-in tool lets developers build custom agents that can see and take action across browser, mobile, and desktop interfaces. Find out more →
What happens when millions of AI agents start negotiating, transacting, and delegating to one another?@weballergy joined our podcast with @fryrsquared to explore the rise of agentic economies – and how we can diversify agent decision-making to avoid AI groupthink. Timecodes:…
Work at OpenAI is being transformed by agents, in every department. Across our entire company, people are using Codex to do work that is more complex, longer-running, and increasingly cross-functional. Our internal usage offers an early look at how agentic tools may reshape…