
GLM-5.2がオープンウェイト部門の最高スコアを獲得
Z aiの「GLM-5.2」は、Artificial Analysis Intelligence Index v4.1で51点を獲得し、オープンウェイトモデルの頂点に立った。GLM-5.1から11点上昇し、MiniMax-M3およびDeepSeek V4 Pro(最大構成)の44点を上回った。
リード文
Z aiが発表したGLM-5.2は、Artificial Analysis Intelligence Index v4.1において51点を獲得し、オープンウェイトモデルにおいて最高位を占めた。このモデルはGLM-5.1から11点の向上を達成し、MiniMax-M3(44点)およびDeepSeek V4 Pro(最大構成、44点)を超越している。同時にGLM-5.2はインテリジェンス対タスク当たりコストのパレート効率線上に位置する。
モデル仕様とスコア
GLM-5.2はGLM-5.1と同じサイズの744B(総パラメータ数)および40B(アクティブパラメータ数)を持つ。Intelligence Index v4.1の総合スコアにおいて、GLM-5.2の51点は、Kimi K2.6の43点も上回っている。GDPval-AA v2ベンチマークではGLM-5.2が1524点、MiniMax-M3が1418点、DeepSeek V4 Pro(最大構成)が1328点を記録した。

評価別改善点
GLM-5.2は複数の評価項目で大幅な改善を示した。科学的推論領域でCritPt評価において16点増加し21%、HLE評価で12点増加し40%に達した。また領域別評価ではAA-LCR(9点増加で71%)、tau3銀行評価(15点増加で27%)、SciCode(7点増加で50%)、TerminalBench v2.1(16点増加で78%)、GPQA Diamond(3点増加で89%)での改善を記録した。

API価格と効率性
GLM-5.2のファーストパーティAPI価格は、入力トークン1M当たり$1.4、出力トークン1M当たり$4.4、キャッシュヒットトークン1M当たり$0.26である。Intelligence Indexタスク当たりのコストは約$0.46で、43kの出力トークンを使用する。これはGLM-5.1の$0.25/タスク(26k出力トークン)と比べてコストが増加している一方、MiniMax-M3($0.18/タスク、24k出力トークン)やKimi K2.6($0.31/タスク、35k出力トークン)と比較される。トークン効率の観点では、DeepSeek V4 Pro(最大構成)は$0.05/タスク(37k出力トークン)で動作する。
コンテキストウィンドウとライセンス
GLM-5.2は1Mトークンのコンテキストウィンドウを備えており、GLM-5.1の200Kトークンから大幅に拡大された。モデルはMITライセンスのもとで公開されており、ファーストパーティAPIおよびDeepInfra、Novita、Nebius、Parasail、Siliconflow、GMI Cloud、Baseten、Fireworksを含む複数のサードパーティプロバイダーで利用可能である。
推論能力とAA-Omniscience指標
GLM-5.2はAA-Omniscience Indexで4点を獲得し、GLM-5.1の2点から向上した。正確度はGLM-5.1の24.2%から25.1%に上昇し、幻覚率はGLM-5.1の29.4%からGLM-5.2の28.1%に改善された。試行率は47%である。Intelligence Indexタスク当たり43kの出力トークンのうち、GLM-5.2は37kの推論トークンを使用する。
筆者の見立て
- GLM-5.2は、GPT-5.5(xhigh)を含むプロプライエタリモデルと同等のレベルにあると解釈されている。
- GLM-5.2は、同じインテリジェンスレベルのオープンウェイトモデルの中でも、より低いトークン効率を持つモデルの範疇に属すると解釈されている。
- GLM-5.2は、インテリジェンス対出力トークン数のチャートにおいて、最も魅力的な領域外に位置していると解釈されている。
この記事は元記事の事実のみに基づいて自動生成されました。
出典
Artificial Analysis「GLM-5.2 is the new leading open weights model on the Artificial Analysis Intelligence Index」 https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index