fast.ai 創設者の Jeremy Howard が X で、軽量モデルを使うと同じ作業で Claude Opus を使う場合に比べ、生成回数(completions)が実際には約10倍に増えると自身の経験として指摘した。理屈は理解していても実運用では差が大きく「昼と夜ほど違う」と表現し、各自で試すよう促している。

Anthropic は推論性能の高い上位の Claude Opus 4.5・4.7 と、速度とコストに優れる Sonnet 4.5・Haiku 4.5 を並行展開している。軽量モデルは単価が低くても、目的に到達するまで生成を繰り返す必要が出る場面では再生成ぶんのトークンと時間が積み上がる。

この指摘は、モデル選びを単価だけで判断する落とし穴を突く。AI を業務に組み込む際は「1回あたりのコスト」ではなく「目的達成までの総回数・総コスト」で評価すべきという視点を与え、どちらの系列を既定に置くかの設計判断に直結する。