Cursorを開発するAnysphereが、自社コーディングモデルComposer 2.5を2026年5月18日に公開した。標準価格は入力100万トークン0.50ドル・出力2.50ドル、高速版は入力3.00ドル・出力15.00ドルで、上位フロンティアモデルの高速プランより低コストに設定されている。独立評価機関Artificial AnalysisのCoding Agent Indexで62(前モデル48から+14)・第3位と評価され、Claude Opus 4.7(66)・GPT-5.5(65)に肉薄した。
ベースは中国Moonshot AIの公開モデルKimi K2.5で、改善地点へ直接報酬を与える強化学習と前モデル比25倍の合成タスクで後段学習している。タスク単価はStandardが0.07ドルで、Opus 4.7 maxの4.10ドル比で約60倍安い。ただし評価はタスクセット依存で割れ、自前ベンチで酷評する声もある。
11日後の5月29日には、Shell/MCP/Fetchの実行を3層で自動承認するv3.6 Auto-review Run Modeを投入。承認待ちを減らす反面、無審査で許すと実行権限の統制が崩れるため、許可リストの最小権限設計が前提になる。
I feel like the greatest limitation is the Claude Code harness itself, it's just hands down the WORST available tool at the moment. Combined with ridiculous pricing and usage limits, Opus 4.8 won't be in my daily arsenal - gpt-5.5 is just better. But good for docs and plans! ✌️