744B級GLM-5を重み公開｜ベンチ未公表で要検証

AI TREND

中国のZ.ai：GLM-5系列を公開

中国のZ.aiが、長時間の自律作業やシステム開発を狙った大規模言語モデル群「GLM-5」「GLM-5.1」「GLM-5.2」を、いずれも総744B（実働40B）パラメータの重み付きで公開した。GitHub の zai-org/GLM-5 は1日あたり約480スターのペースで急上昇している。

3 の要点を3分で

中国のZ.aiが、長時間の自律作業やシステム開発を狙った大規模言語モデル群GLM-5／GLM-5.1／GLM-5.2を公開した。いずれも総744B・実働40Bパラメータ規模で、重みがHugging FaceとModelScopeでBF16およびFP8形式で配布されている。GitHub の zai-org/GLM-5 は1日あたり約480スターのペースで急上昇し、総スター数は4,574に達している。

前世代のGLM-4.5は総355B・実働32Bで、事前学習データは23兆トークンだった。GLM-5ではこれを総744B・実働40B、データ28.5兆トークンへ拡大した。最新のGLM-5.2は100万トークンの長文脈に対応し、4層ごとに索引を共有する仕組み（IndexShare）で計算量を約2.9倍削減したと説明している。SGLang・vLLM・Transformersでの自前運用にも対応する。

ただし公式はGLM-5.2公開時点でベンチマーク数値を出しておらず、第三者記事に出てくる比較値は裏取りができない。仕様の大きさは確認できるが、実性能は自社タスクでの実測が必要になる。

押さえるポイント

この変化で何が要点か。図解と出典つきで一目で。

744B級（実働40B）のフロンティア級モデルを重み付きで公開
GLM-5.2は100万トークンの長文脈処理に対応すると説明
重みはHugging FaceでBF16とFP8の両形式で配布

5W1Hでサクッと理解

構造化された事実を最初に。誰が何をいつどこでなぜどのように。

誰が: 中国のZ.ai
何を: GLM-5系列を公開
いつ: 2026年6月
どこで: Hugging Face
なぜ: オープン勢の性能提示
どのように: 重みをBF16/FP8配布

背景

GLM系列はZ.aiが開発するオープンウェイトの基盤モデルで、前世代のGLM-4.5は総パラメータ355B（うち実働32B）だった。GLM-5ではこれを744B（実働40B）へ拡大し、事前学習データも23兆から28.5兆トークンへ増やしている。長文脈を低コストで扱うため疎な注意機構（DeepSeek Sparse Attention）を取り入れ、さらに大規模強化学習を効率化する独自基盤「slime」を開発したとしている。GLM-5.2では4層ごとに索引を共有する仕組み「IndexShare」を導入し、100万トークン時の計算量を約2.9倍削減したと説明している。

なぜ今注目なのか

744B級のモデルを重み付きで公開する動きは、クローズドな最前線モデルとの差を埋めるオープン勢の存在感を示す。コーディングやエージェント作業での性能を主張しており、自社環境で動かしたい開発者には検証材料となる。ただしGLM-5.2の公開時点では公式がベンチマーク数値を出しておらず、本文中の比較値は参考にとどめて自分で確かめる姿勢が要る。

744B級モデルが重み付きで公開された

中国のZ.aiが、複雑なシステム開発や長時間の自律作業（エージェント処理）を狙った大規模言語モデル群「GLM-5」「GLM-5.1」「GLM-5.2」を公開した。いずれも総744B・実働40B（推論時に実際に動く部分）パラメータ規模で、重みがHugging FaceとModelScopeでBF16およびFP8形式で配布されている。GitHub の zai-org/GLM-5 リポジトリは1日あたり約480スターのペースで急上昇し、総スター数は4,574に達している。