IBM Granite 4.1公開：8Bモデルが32B級MoEを超え、512Kコンテキスト対応

IBM Granite チーム：Granite 4.1 LLM公開 — 画像: AI生成

IBMがHugging Face上で公開したGranite 4.1 LLMsの技術解説記事は、モデル配布と同時に構築パイプラインの内部を詳細に開示した点で、オープンソースLLMの中でも情報密度が高い。

ラインナップは3B・8B・30Bの3サイズで、いずれもApache 2.0ライセンス。特に注目されるのは8Bインストラクトモデルが、旧世代のMoEモデルであるGranite 4.0-H-Small（32B-A9B）と同等以上の性能を達成した点だ。密モデル側でMoEを追い抜いたことは、推論時のGPUメモリ要件とスループットの設計に直接影響する。

事前学習は約15兆トークンを使った5段階パイプラインで構成される。最終段階でコンテキスト長を512Kトークンまで拡張しており、長文RAGや契約書・コードベース全体を扱う用途での前処理設計を簡素化できる。

ポストトレーニングでは、約410万件の高品質サンプルを用いたSFTをLLM-as-Judgeフレームワークで6次元（指示遵守・正確性・完全性・簡潔性・自然さ・校正）評価している。強化学習はオンポリシーGRPO（Shao et al., 2024）にDAPO損失（Yu et al., 2025）を組み合わせ、数学・コーディング・指示遵守・一般チャットを強化した。

日本のエンタープライズにとっては、Apache 2.0で商用利用が自由な点、3サイズでオンプレ・エッジ・サーバの構成を柔軟に組める点、そして構築手法が文書化されているため社内審査やモデルカード要件に応えやすい点が意思決定に効く。8Bで32B級MoEを代替できる前提が自社タスクで成立するかは、評価セットでの実測が次の一手になる。

IBM Granite 4.1公開：8Bモデルが32B級MoEを超え、512Kコンテキスト対応の本文内説明図 — 図解: 学習パイプライン全体像 - 15兆トークン・5段階事前学習からSFT・強化学習まで、Granite 4.1の構築

押さえるポイント

8BモデルがGranite 4.0-H-Small（32B-A9B）と同等以上の性能を達成
約15兆トークンの5段階事前学習、最終段で512Kコンテキスト対応
全サイズApache 2.0ライセンスで商用利用が自由

5W1Hでサクッと理解 誰が IBM Granite チーム 
 何を Granite 4.1 LLM公開 
 いつ 2026年4月30日 
 どこで Hugging Face 
 なぜ 構築手法の開示 
 どのように 3サイズApache 2.0 

何が起きたか

要点IBMがオープンソースLLM『Granite 4.1』を3B・8B・30Bの3サイズで公開し、事前学習・SFT・強化学習の構築パイプラインを開示した。8Bモデルは旧世代の32B-A9B MoEモデルと同等以上の性能を達成している。

3つの視点で読む

開発現場

8Bという密モデルが旧世代32B-A9B MoEと同等以上に達したことで、同等性能を得るための必要パラメータ数の境界が密モデル側に動いた。512Kコンテキストを事前学習の最終段で拡張する構成、約410万件SFTをLLM-as-Judgeで6次元採点する構成、GRPOにDAPO損失を組み合わせる構成までレシピが開示され、再現検証の前提が揃った。

事業判断

Apache 2.0で3B・8B・30Bの3サイズが揃ったため、オンプレ・エッジ・サーバの選択肢をライセンス条項の再交渉なしに切り替えられる。8Bで32B級MoEを代替できる前提が成立すれば、GPUメモリ要件と推論スループットのコスト構造がMoEホスティング前提の構成から変わる。

リスク・ルール

Apache 2.0かつ構築パイプライン（データ規模・SFT件数・評価軸・RL手法）が文書化されたことで、調達側がモデル由来リスクを審査する際の開示要件を満たしやすい。日本企業が社内利用や政府調達で求められるモデルカード相当の説明責任に対し、一次情報として参照できる資料が増えた。

追い風と向かい風

追い風を受ける側

オンプレLLMを運用する日本のエンタープライズApache 2.0で3サイズ揃い、8Bで32B級MoE相当の性能が得られれば推論基盤の必要GPU容量を圧縮できる
独自モデル開発を進める研究機関・スタートアップ15兆トークン5段階事前学習、SFT 410万件のLLM-as-Judge評価、GRPO+DAPOまでレシピが開示され、再現・改変の出発点になる
長文処理を必要とする業務アプリ開発者512Kトークンのコンテキスト長が最終事前学習段で拡張されており、長文RAGや契約書処理の前処理設計を簡素化できる

向かい風を受ける側

同等規模のプロプライエタリAPI提供ベンダー8Bクラスで32B-A9B MoE相当の性能が商用自由なライセンスで出たことで、クローズドAPIの価格正当化が難しくなる
MoE専用にホスティング最適化したベンダー8B密モデルで同等性能が出るなら、MoE前提のメモリ・ルーティング最適化の優位性が相対的に縮む