LLMをノイズ通信路で捉える新スケーリング則

AI TREND

論文著者ら：シャノン型則を提案

LLMの訓練を雑音通信路上の情報伝送としてモデル化する「Shannon Scaling Law」がarXivで公開され、ICML 2026に採択された。モデルサイズや訓練トークンの増大が必ずしも性能改善につながらない現象を、信号対雑音比（SNR）の観点から統一的に説明する。

3 の要点を3分で

何が新しいのか

本研究「LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws」は、LLMの訓練をシャノン・ハートレー定理に基づく雑音通信路上の情報伝送として定式化した。モデルパラメータをチャネル帯域幅、訓練トークンを信号電力に対応付けることで、学習信号と内在ノイズの相互作用を明示的に捉える。

従来のべき乗則は単調改善を前提としていたため、計算量を増やしているのに性能が落ちる「破滅的過学習」や「量子化による劣化」を説明できなかった。本論文はこれをSNR不足下でのノイズ増幅と解釈し、単調改善からU字型劣化への転移を理論的に導出する。

検証範囲と外挿性能

検証はPythiaおよびOLMo2を対象に、ガウスノイズ・量子化・数学/QA/コードのSFTという摂動条件で行われた。Shannon Scaling Lawは古典的なスケーリング則および近年の摂動考慮型スケーリング則と比較して高いR²を達成し、先行手法が捉え損ねていた損失盆地（loss basin）も再現したと報告されている。

外挿性能の指標として、6.9B以下のPythiaモデルかつ180B以下のトークンで学習したモデルから、未見の12Bモデル・307BトークンをプールR²=0.847で予測した点が示されている。単調ベースラインはこの外挿で崩壊するとされ、SNR枠組みの実用的な含意が大きい。

日本の実装現場への含意

国内で基盤モデルを事前訓練するチーム、量子化・蒸留で推論コストを下げるチーム、ドメインSFTを行うチームのいずれもが、「とにかくスケールする」戦略の限界点をSNRという観測可能な変数で扱える。論文はICML 2026採択済みであり、原典をarXivで確認したうえで自社の摂動実験ログと突き合わせる作業が現実的な次の一歩となる。

LLMをノイズ通信路で捉える新スケーリング則の本文内説明図 — 図解: シャノン型則を提案 - LLMの訓練を雑音通信路上の情報伝送としてモデル化するShannon

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

シャノン・ハートレー定理をLLM訓練に適用した初の統一理論枠組み
破滅的過学習・量子化劣化のU字型性能低下を理論的に説明
Pythia 6.9B以下のデータから12B・307Bトークンを R²=0.847 で外挿

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: 論文著者ら
何を: シャノン型則を提案
いつ: 2026年5月23日
どこで: arXiv
なぜ: U字劣化の説明
どのように: 通信路モデル化

何が起きたか

LLMの訓練を雑音通信路上の情報伝送としてモデル化する「Shannon Scaling Law」がarXivで公開され、ICML 2026に採択された。モデルサイズや訓練トークンの増大が必ずしも性能改善につながらない現象を、信号対雑音比（SNR）の観点から統一的に説明する。

3つの視点で読む

技術 / 事業 / 規制 — この変化があなたの判断にどう効くか。

技術への影響

従来の単調なべき乗則では説明できなかった「破滅的過学習」「量子化による劣化」を、SNR不足によるノイズ増幅として統一的に記述する。Pythia・OLMo2でのガウスノイズ・量子化・SFT摂動実験において既存スケーリング則を上回るR²を達成し、損失盆地（loss basin）の予測にも成功している。

市場・事業への影響

6.9Bモデル・180Bトークン以下のデータから12Bモデル・307Bトークンの性能をプールR²=0.847で外挿する精度は、事前訓練と量子化展開の試行回数を削減する。SNRを設計変数として扱えば、計算予算配分の判断材料が単調スケーリング前提から変わる。

規制・リスク

規制への直接含意は薄い。ただしモデル性能の予測可能性が高まることは、安全性評価や能力測定の事前見積もりという社会的要請に対する基礎研究の進展にあたる。

機会と脅威

この変化で機会を得るのは誰か、脅威にさらされるのは誰か。

機会 3

事前訓練を行う研究機関・基盤モデル開発者

小規模モデルでの実験から大規模設定の性能を外挿でき、計算予算の試行錯誤を削減できる

量子化・蒸留を行う実装者

量子化誘発劣化がSNR枠組みで定量化され、安全な圧縮率の境界を見積もる理論根拠が得られる

SFT実施者

数学・QA・コードのSFTでもU字型劣化を予測でき、過剰なファインチューニングを切り分けられる

脅威 1

単調スケーリング則を前提に投資判断するチーム

「とにかくトークンを増やす」戦略がSNR不足下で性能を落とす領域があり、前提の見直しが必要になる

今やるべきこと

立場別、明日から動ける一手。

技術を選ぶ人へ

arXiv論文でSNR定義と帯域幅・信号電力への写像式を、自社の事前訓練・SFT設計の前提と照合するために確認する。

事業を決める人へ

量子化展開や追加事前訓練の意思決定基準を、単調改善前提ではなくSNR維持・U字劣化の観測点を含む形で定義する。

手を動かす人へ

自社の小規模モデルでガウスノイズ・量子化・SFT摂動下の損失曲線を、Shannon Scaling Lawの予測値と比較できる形で測る。

時系列タイムライン

2026年5月23日論文がarXivで公開される
ICML 2026 本論文の採択が確定

情報ソース

LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws 一次情報公式研究論文
モデル配布: What is Huggingface? モデル配布
モデル配布: What is Spaces? モデル配布

学術の記事

読み込み中...

論文著者ら：シャノン型則を提案

何が新しいのか

検証範囲と外挿性能

日本の実装現場への含意

関連リンク

時系列タイムライン

SNSの反応

主な声

関連コンテンツ

関連キーワード

関連するAIトレンド記事

情報ソース

人気記事ランキング

学術の記事