arXiv投稿著者:ITF幾何不一致を定量化
画像: AI生成

本論文は、カオス力学系をRNNで再構成する分野(DSR)で標準的に使われてきたIdentity Teacher Forcing(ITF)の理論的立ち位置を、一般化ベイズ更新として整理し直したうえで、自由走行モデルの周辺尤度との最適化幾何の不一致を定量化した研究である。

対象は解釈可能なalmost-linear RNN(AL-RNN)の確率的スイッチング拡張版で、Louis' identityを用いて曖昧さを考慮した観測情報量を推定する。その結果、ITFのように単一の強制レジームパスに条件付ける目的関数は曲率を過大評価する一方、複数のスイッチング説明が残る状況では周辺尤度の曲率が欠損情報補正によって低減されることが示された。両者はパラメータ空間上で異なる最適化景観を描くため、どちらを訓練目的に選ぶかが学習ダイナミクスに直接影響する。

実証面ではLorenz-63を用いた実験が行われ、ITF事前学習後にウィンドウ化された証拠ファインチューニング(windowed evidence fine-tuning)を適用すると、保留データ上の証拠は改善するが、アトラクター形状やリアプノフ指数といった力学的QoI(quantities of interest)はITF事前学習モデルより悪化する場合があることが報告された。これは「尤度が良くなれば力学も再現される」という直感が成り立たない反例であり、モデル評価指標の選択そのものに警告を発する結果となる。

実務への含意は明確で、DSRパイプラインを科学計算や制御に用いる場合、単一指標での最適化ではなく、証拠と力学的QoIの併用評価が必要になる。