自作AI調整で計算を溶かさない｜Nova Forge指針

AI TREND

AWS：調整指針を公開

AWSが自社向けカスタムモデル基盤Amazon Nova Forgeで、学習率・バッチサイズ・チェックポイント選択といった調整パラメータの最適化指針を公開した。専門業務に特化させつつ汎用能力を保ち、高額な学習失敗を避ける判断基準を示している。

3 の要点を3分で

AWSが自社向けカスタムモデル基盤Amazon Nova Forgeのハイパーパラメータ最適化指針を公開した。中核の指摘は、学習率が全手法で最も敏感な設定であり、自社データとAWS側データを混ぜるデータ混合の際に既定値から外すことが学習不安定の最大要因だという点だ。

Nova Forgeは継続事前学習(CPT)・教師あり微調整(SFT)・強化微調整(RFT)の3手法を提供し、順に使うと最も強い結果が出る。SFTは1タスクあたり1,000〜10,000件の高品質な入出力例が目安で、量より質・一貫性・多様性が重要とされる。RFTは元の精度が低すぎても高すぎても効果が出にくく、新しい能力をゼロから教える手段ではない。

独自AI構築は学習を回すたびに計算費用が積み上がる。失敗の前兆を早期に捉える指針が公開されたことで、設計段階で無駄な学習実行のコストを削れる判断材料が増えた。特化と汎用能力維持の両立という普及の壁に対し、実務的な設計図が示された格好だ。

自作AI調整で計算を溶かさない｜Nova Forge指針の本文内説明図 — 図解: RLスキル生成 - 軌跡生成を使う強化学習基盤

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

学習率が全手法で最も敏感、既定値から外すと学習が崩れる
CPT・SFT・RFTの3手法を順に使うと最も強い結果が出る
SFTは1タスク1,000〜10,000件、量より質と一貫性が重要

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: AWS
何を: 調整指針を公開
いつ: 2026年6月3日
どこで: AWSブログ
なぜ: 学習失敗回避
どのように: 学習率最適化

背景

大規模言語モデル（LLM）は汎用タスクでは高い性能を示すが、社内固有データや専門用語を要する業務では精度が落ちやすい。Amazon Nova Forgeは、Amazon Novaを土台に自社の独自データを混ぜ込みながら独自モデルを構築できる仕組みを提供する。中核となるのが「データ混合（data mixing）」で、独自データとAWS側が用意した学習データを混ぜることで、専門領域を学ばせつつ汎用的な推論や指示追従の能力を維持する。これは領域特化で起きがちな「破滅的忘却（catastrophic forgetting）」と呼ばれる、元々の能力を失う現象を防ぐ狙いがある。

なぜ今注目なのか

企業が独自AIを作る際、特定業務に特化させると汎用能力が壊れるという調整の難しさが普及の壁になっている。本記事は学習率の設定ミスが最大の不安定要因であることや、強化学習による微調整（RFT）が効く前提条件など、無駄な計算コストを避ける実務的な判断基準を示す。自社モデル構築を検討する技術者にとって、失敗を事前に回避する設計図になる。

学習率の設定ミスが計算費用を溶かす最大要因

AWSがNova Forgeのハイパーパラメータ最適化指針で「学習率(learning rate=モデルが1回の更新でどれだけ重みを動かすかの度合い)が全手法で最も敏感な設定」と名指しした。とくに自社データとAWS側の学習データを混ぜる「データ混合」のとき、既定値から学習率を外すことが学習不安定の最大要因だと特定している。

Fine-tuning for domain-specific tasks means improving performance in one area without degrading the model's general capabilities, and getting that balance right is harder than it looks.
出典: The art and science of hyperparameter optimization on Amazon Nova Forge

引用は「専門業務向けの微調整とは、汎用能力を落とさずに一領域の性能を上げることで、その釣り合いを取るのは見た目より難しい」という意味だ。独自AIは学習を1回回すたびに計算費用が積み上がる。失敗の原因が学習率という一点に集中すると分かれば、設計段階で最も力を入れるべき箇所が見える。

3手法を順に積むと最も強くなる

Nova Forgeはモデルを自社向けに育てる手段を3つ用意している。読者が判断に使えるよう、各手法の役割と前提条件を分けて押さえたい。

継続事前学習(CPT): 既存のNovaに大量の自社データを追加学習させ、専門領域の土台を作る。
教師あり微調整(SFT): 入力と理想の出力をペアで与えて振る舞いを整える。目安は1タスクあたり1,000〜10,000件の高品質な入出力例で、件数を増やすより質・一貫性・多様性が効く。
強化微調整(RFT): フィードバックで出力を磨く。ただし元の精度が低すぎても高すぎても効果が出にくく、新しい能力をゼロから教える手段ではない。

AWSはこの3段階を順に使うと最も強い結果が出ると整理している。逆に言えば、RFTだけで未習得の能力を獲得しようとするのは前提を外した使い方になる。データ混合の比率や評価の考え方は、関連する実践ガイドでも具体的に解説されている。

balance your customer data around 50 percent of the total mix for most use cases
出典: Nova Forge data mixing 実践ガイド

引用は「多くの用途では自社データを全体の混合比のおよそ50%に保つ」という目安で、専門領域を学ばせつつ汎用能力を保つための釣り合いを数値で示している。

得をするのは『データを持つが学習費用を抑えたい』企業

社内固有データや専門用語を扱う事業者は、汎用APIだけでは精度が落ちやすい。Nova Forgeで失敗の前兆が明文化されたことで、無駄な学習実行を減らして独自モデルに踏み込みやすくなる。

一方、汎用APIだけで業務特化を狙うチームは、専門タスクの精度面で不利が残る。ただし自作調整には学習率の管理など相応の設計知識が要ると同じ指針が示している。

RFTで新しい能力を一から教えたい開発者にとっては期待外れになりやすい。RFTは既にある能力を磨く手法で、元の精度が低すぎても高すぎても効きにくいと明示されたからだ。独自AI構築を検討する国内の実装担当者は、PoCに入る前にSFTの件数目安からデータ準備の規模を見積もれる立場で、計画段階での判断材料が増えた側に立つ。