今日のAIトレンド|エージェントが本番と現場へ降りた日
今日の要点
編集判断で選び抜いた 7 本。
30 秒で読むなら
今日の AI 動向を 1 行ずつで把握。各項目をクリックすると元記事に飛びます。
- OpenAIが次世代モデルをプレビュー
GPT-5.6 Solをプログラミング・科学・サイバーセキュリティ強化として先行公開、提供時期や数値は未公開で方向性の提示にとどまる。
- StripeがAIで審査処理を26%短縮
Amazon Bedrockの本番エージェントで金融犯罪審査を支援し、有用性評価96%超・最終判断は人間が維持。
- Geminiに画面操作が標準搭載
Gemini 3.5 Flashがブラウザ・モバイル・デスクトップを横断する操作機能を外部ツールなしで提供。
- OpenAIが自社チップを量産発表
Broadcomと共同設計したLLM推論特化チップ「Jalapeño」で、製品からモデル・インフラまで内製化を進める。
- 既存APIを書き換えずエージェント対応
AWSが薄い変換層『エージェント・オーバーレイ』を提案、REST APIをA2A連携へ業務改修なしで接続。
- NotionからCursorへ実装委任
仕様書からCursorを呼ぶとクラウドAIがプルリク形式で実装案を返し、仕様作成から着手までツール切替が消える。
- 古い映像をSageMakerで高解像度化
SeedVR2をオンデマンドGPUで動かし、処理時だけ起動・終了で自動停止する映像修復の実装手順を公開。
エージェントが「実験」から「本番の補助役」へ移った
能力宣伝ではなく、誰の何時間が消え、どう誤りを抑えるかが具体的に語られた一日。
Stripeは金融犯罪対策の審査をAmazon BedrockのAIエージェントで支援し、審査の処理時間を約26%削減した。回答の有用性評価は96%超。鍵は能力の高さではなく設計で、ツール実行の結果を必ず「観測」として処理する仕組みで誤回答を抑え、最終判断は人間の専門家が握り続ける。AIが提案し人が決める補助役の境界を本番品質で引いた点が、規制が厳しい審査業務へエージェントを持ち込む際の実装テンプレートになる。
Google DeepMindはGemini 3.5 Flashに画面操作機能を標準搭載し、ブラウザ・モバイル・デスクトップの3環境を横断するエージェントを開発者が組めるようにした。外部の操作ツールを別途組み込まずモデル側で完結するため、画面を見て操作する業務自動化の構築コストが下がる。Stripeが示した「人が最終判断する境界」とあわせ、操作系エージェントを業務に入れる前提が整いつつある。
「作り直さず、既存資産に乗せる」が共通言語になった
新規構築でなく、いま動いているものへ薄く被せて価値を出す動きが揃った。
AWSは既存のREST APIを書き換えずにエージェント連携(A2A)へ対応させる『エージェント・オーバーレイ』という薄い変換層を提案した。業務ロジックの改修もインフラの二重運用も不要で、稼働中のレガシーサービスをエージェントから呼べる入口に変える。新規プラットフォームへの移行を待たずにエージェント化を始められるため、既存システムを抱える現場の着手障壁を下げる。
Notionの仕様書からCursorを呼び出すと、クラウドのAIが実装案をプルリク形式で返す機能が公開された。これまで仕様ツールとエディタを行き来していた作業が、ツールを切り替えずに仕様作成から実装着手まで一本につながる。結果がプルリクで戻るため、人間がレビューして取り込む既存のコードレビュー手順の中に収まる点が実務的だ。
AWSは動画修復モデルSeedVR2をSageMaker AI上で動かす実装手順を公開した。GPUは処理時だけ起動し、終わると自動停止する構成で、低解像度の既存映像を高解像度へ変換できる。映像を撮り直さず手持ちの資産を再活用する発想で、ここも「作り直さず乗せる」流れの一例だ。
OpenAIは縦に積む:モデルとチップを同時に動かした
他社が既存資産への載せ替えを語る一方、OpenAIは製品・モデル・インフラの内製を進めた。