AWSが自社向けカスタムモデル基盤Amazon Nova Forgeのハイパーパラメータ最適化指針を公開した。中核の指摘は、学習率が全手法で最も敏感な設定であり、自社データとAWS側データを混ぜるデータ混合の際に既定値から外すことが学習不安定の最大要因だという点だ。
Nova Forgeは継続事前学習(CPT)・教師あり微調整(SFT)・強化微調整(RFT)の3手法を提供し、順に使うと最も強い結果が出る。SFTは1タスクあたり1,000〜10,000件の高品質な入出力例が目安で、量より質・一貫性・多様性が重要とされる。RFTは元の精度が低すぎても高すぎても効果が出にくく、新しい能力をゼロから教える手段ではない。
独自AI構築は学習を回すたびに計算費用が積み上がる。失敗の前兆を早期に捉える指針が公開されたことで、設計段階で無駄な学習実行のコストを削れる判断材料が増えた。特化と汎用能力維持の両立という普及の壁に対し、実務的な設計図が示された格好だ。
OpenAI frontier models and Codex are now generally available on AWS, giving enterprises a new way to build on Amazon Bedrock with OpenAI through the security, compliance, and governance workflows they already use. This is also the beginning of a broader expansion of OpenAI…