中国のZ.aiが、長時間の自律作業やシステム開発を狙った大規模言語モデル群GLM-5GLM-5.1GLM-5.2を公開した。いずれも総744B・実働40Bパラメータ規模で、重みがHugging FaceとModelScopeでBF16およびFP8形式で配布されている。GitHub の zai-org/GLM-5 は1日あたり約480スターのペースで急上昇し、総スター数は4,574に達している。

前世代のGLM-4.5は総355B・実働32Bで、事前学習データは23兆トークンだった。GLM-5ではこれを総744B・実働40B、データ28.5兆トークンへ拡大した。最新のGLM-5.2100万トークンの長文脈に対応し、4層ごとに索引を共有する仕組み(IndexShare)で計算量を約2.9倍削減したと説明している。SGLang・vLLM・Transformersでの自前運用にも対応する。

ただし公式はGLM-5.2公開時点でベンチマーク数値を出しておらず、第三者記事に出てくる比較値は裏取りができない。仕様の大きさは確認できるが、実性能は自社タスクでの実測が必要になる。