今日のAIトレンド|AIが現場の実装に降りた日
今日の要点
編集判断で選び抜いた 7 本。
30 秒で読むなら
今日の AI 動向を 1 行ずつで把握。各項目をクリックすると元記事に飛びます。
- Codexが社内仕様書まで担当
Notionが仕様書を一括生成しWeb音声入力をCodexで構築、Windows版も加わり利用環境が拡大。
- Claude Fable 5がBedrock到着
Anthropic最上位クラスがAWSで提供開始、危険指示では自動で下位Opus 4.8に切り替わる安全機構付き。
- 再学習の品質劣化を自動検出
BridgeWiseがBedrockのClaudeを採点役にし、専門家の手作業に頼らず劣化を検知する評価基盤を約3週間で構築。
- Gemma 4 QATでメモリ4分の1
GoogleがQAT版チェックポイントを公開、性能維持のままE2Bが約1GBで動きllama.cpp/vLLM対応。
- EMR Serverlessが対話型に
Spark Connect方式で手元のJupyter/VS CodeからクラウドのSpark処理を呼べる対話型セッションを提供開始。
- ヒューマノイド学習を大規模に
AWSがIsaac Labでの歩行学習を、常設クラスタと使い捨て計算を同じコードで使い分ける手順とコードを公開。
- ローカルLLM選定CLIが急上昇
whichllmが手元のGPU/CPU/メモリを検出し、実ベンチで動くローカルLLMを順位付け、+631★/日。
上位モデルが届き、それを「安く小さく」回す側が同時に整った
今日の通底テーマは、性能の上振れと運用コスト・必要メモリの圧縮が同じ日に進んだこと。
AWS上でClaude Fable 5が使えるようになった一方、Googleは量子化対応学習(QAT)版のGemma 4を公開した。クラウドで最高性能を取りに行くルートと、ローカルで約4分の1のメモリで動かすルートが同日に強化された格好だ。Fable 5はサイバー・生物・化学・健康の危険指示で自動的に下位のOpus 4.8へ切り替わる安全機構を内蔵し、Gemma 4 QATはE2Bが約1GBに収まりllama.cpp・vLLMで動く。「クラウドの上限を上げる」のか「手元の下限を下げる」のかという調達判断が、今日まとめて選択肢として揃った。
Gemma 4 QATでローカル実行の現実味が増したのと表裏で、GitHub急上昇のwhichllmが効いてくる。手元のGPU/CPU/メモリを自動検出し、パラメータ数ではなく実ベンチマークで実際に動くローカルLLMを順位付けするCLIで、+631★/日と注目を集めた。VRAMに収まるかだけでなく実性能で並べるため、軽量モデルが増えたいま「結局どれを入れるか」の選定コストを下げる。OSSのCLIツールなのでセルフホスト前提の検証に組み込みやすい。
AIが「現場の作業」を回す側に入ってきた
モデル提供だけでなく、評価・データ処理・コード生成という日々の作業へAIが組み込まれた事例が並んだ。
資産運用AIのBridgeWiseは、独自学習モデルの回答品質をBedrock上のClaudeに採点させる自動評価基盤を構築した。評価処理はSageMakerの処理ジョブで実行し、結果はS3へ、運用指標はCloudWatchへ送る。AWS PACEチームと約3週間で組み上げ、人手は採点のズレ検出のための一部確認に限定した。再学習のたびに専門家が目視する運用から抜けられる点が要で、独自モデルを継続的に育てるチームには「評価をどう自動化するか」の具体的な型になる。
OpenAIが公開したNotionのCodex活用では、仕様書を一度の指示でまとめて作る運用(one-shot spec)と、Web版の音声入力機能をCodexで構築した事例が示された。Codexは2026年3月4日にWindows版が利用可能になり利用環境が広がっている。ただし公開されたのはNotion社内の運用例であり、業績への効果を示す定量的な公開数値はない。導入是非は「自社のどの作業をAIに任せるか」を社内で切り分けてから判断するのが現実的だ。
AWSはEMR ServerlessでSpark Connect方式の対話型セッションを提供開始した。JupyterやVS Codeなど手元のエディタからクラウド上のSpark処理を呼び出せる。データ前処理を含むAIワークロードを、ローカルの開発体験のままクラウド計算へ寄せられる点が実務的な変化だ。