Name: GLM 5
Rating: 34 (1 reviews)
Author: Zhipu

Question 1

GLM 5是什么？

Accepted Answer

一、简介与定位

GLM 5是中国智谱AI于2026年2月11日发布的旗舰级开源大模型，核心定位为面向复杂系统工程与长程智能体任务的基座模型，主打编程、高阶推理与智能体自主协作能力。

其名称中“GLM”是“General Language Model”（通用语言模型）的缩写，无额外后缀，核心功能涵盖复杂代码生成与调试、多步逻辑推理、高质量创意写作、内置智能体架构及海量长上下文处理；官方使用门槛方面，个人开发者可免费试用基础功能，API接口提供新用户免费额度，高级功能需订阅付费套餐，且上线初期按Max、Pro、Lite用户等级分阶段开放；同期未发布同系列“兄弟模型”，但其与上一代GLM 4系列模型形成迭代衔接，共同完善智谱GLM家族生态。

目前GLM 5处于生命周期的活跃期，是智谱AI当前的主力旗舰模型，尚未被淘汰；其最突出的核心特点是采用混合专家架构，在开源大模型中实现编程与智能体能力的顶尖表现，可自主完成复杂工程任务，大幅降低开发门槛。

二、发展历程

2.1 研发背景

GLM 5发布前，行业内主流大模型呈现“闭源领跑、开源追赶”的格局，闭源领域有GPT-4o、Claude Opus 4.5、Gemini 3 Pro等，主打全能型性能但使用成本高、不开源；开源领域则有DeepSeek-V3、Llama 3等，虽门槛低但在复杂编程、长程智能体任务上存在明显短板。当时行业核心痛点集中在：开源模型难以支撑复杂软件工程，闭源模型成本过高且无法自主部署，同时大模型正从“被动问答”向“主动解决问题”进化，市场亟需一款能兼顾开源自由性与顶尖性能的基座模型，GLM 5正是在这样的行业局势下应运而生，聚焦填补开源模型在智能体与复杂编程领域的空白。

2.2 关键节点

2026年1月8日，智谱AI创立发起人兼首席科学家唐杰发布内部信，正式宣布计划推出新一代旗舰模型GLM 5，标志着该模型的研发进入收尾阶段。同年2月，全球模型服务平台OpenRouter上线一款代号为“Pony Alpha”的匿名模型，其出色的编程与智能体能力迅速引发全球开发者社区热议，据知情人士透露，该匿名模型正是GLM 5的测试版本。经过短暂的灰度测试与优化，2026年2月11日深夜，智谱AI正式对外发布GLM 5，同步开放部分API接口与开源权限，随后因流量爆发性增长，逐步推进不同等级用户的全面开放。

2.3 家族构成

GLM 5隶属于智谱AI GLM（通用语言模型）系列，该家族自推出以来，形成了覆盖不同性能、不同场景的模型矩阵，核心成员包括：

GLM 3系列：作为家族的基础款开源模型，定位为轻量型通用模型，参数量适中，主打中文处理与基础对话、简单代码生成，适配个人开发者与中小企业的轻量化需求，是GLM系列积累用户基础的核心模型。

GLM 4系列：上一代旗舰模型，分为多个版本，涵盖从基础版到Max版的梯度配置，在中文理解、逻辑推理上实现突破，首次引入多模态能力雏形，为GLM 5的混合专家架构与智能体能力奠定了技术基础，目前仍作为中低端场景的主力模型使用。

GLM 5：当前家族旗舰模型，定位为高阶开源基座模型，主打编程、智能体与长程推理，参数量与性能大幅提升，是家族中首个实现开源模型性能比肩顶尖闭源模型的产品，面向复杂工程场景与专业开发者。

三、核心技术剖析

3.1 固有技术

GLM 5继承了GLM系列模型的核心底层技术，首先延续了上一代模型的对齐手段，采用监督微调与强化学习结合的方式，确保模型输出的准确性与实用性，避免出现无意义的冗余内容；其次，继承了GLM系列对中文语境的深度优化，在中文语义理解、中文创意写作、中文代码注释等场景下，保持了家族一贯的优势；此外，其基础架构延续了GLM系列对开源生态的适配性，可直接兼容vLLM、SGLang等主流推理框架，降低开发者的部署成本，这也是GLM系列开源模型的核心竞争力之一。

3.2 创新技术

GLM 5的核心创新集中在架构与性能优化上，重点解决了开源模型在复杂任务处理、长文本效率、推理成本上的痛点，具体创新点如下：

1. 混合专家架构（MoE）升级：采用7450亿总参数量、440亿推理活跃参数的混合专家架构，包含256个专家，每次推理仅激活8个专家，稀疏度达5.9%。这种设计的核心优势的是“兼顾性能与成本”——总参数量提升保证了复杂任务处理能力，而仅激活部分专家则大幅降低了推理时的算力消耗，让开源模型也能支撑大规模工程任务。

2. 引入DeepSeek稀疏注意力机制（DSA）：这是GLM 5提升长文本处理能力的关键技术，通过两阶段流程优化注意力计算：首先由轻量级组件快速扫描所有历史token并打分，筛选出与当前任务最相关的Top-k个token；再对筛选出的token进行完整的注意力计算，其余token直接跳过。这种方式既解决了传统注意力机制处理长文本时效率低、算力消耗大的问题，又能保证长上下文的保真度，让模型可轻松处理200K上下文窗口的海量信息。

3. 多Token预测（MTP）优化：在训练阶段共享3层MTP模块参数，在不增加显存开销的前提下，提升了推测解码的词元接受率，进而加快模型的生成速度。简单来说，就是让模型在生成内容时，能同时预测多个token，减少等待时间，尤其在代码生成、长篇写作等场景下，效率提升明显。

4. 异步解耦强化学习基础设施：构建了中心化的多任务Rollout编排器，将模型的推理（生成）与训练引擎在物理设备上解耦，彻底解决了长周期智能体任务中GPU空闲等待的问题，让模型能更高效地完成多步协作任务，比如自主规划软件开发流程、多步骤调试代码等。

四、表现评估

4.1 历史与现状

GLM 5刚发布时，凭借其匿名测试版本“Pony Alpha”的出圈表现，一经发布便引发全球开发者关注，迅速登顶开源模型排行榜，成为当时最受瞩目的国产开源大模型，打破了海外开源模型在高阶编程领域的垄断。截至2026年4月，GLM 5仍保持开源模型中的顶尖地位，虽面临部分新发布开源模型的竞争，但在编程、智能体领域的优势依然明显；同时，智谱AI持续优化模型性能，修复已知短板，完善API服务，其用户群体从个人开发者扩展到中小企业，甚至部分大型企业将其用于复杂工程辅助，市场认可度持续提升。

4.2 优势亮点

结合业内公认的排行榜数据与实际测试表现，GLM 5的优势主要集中在三个核心维度，表现突出：

1. 编程能力：在全球权威的SWE-bench-Verified（真实GitHub Issue解决能力测试）中取得77.8的开源模型最高分，在Terminal Bench 2.0（终端环境编码测试）中取得56.2的高分，编程能力对齐Claude Opus 4.5，性能超过Gemini 3 Pro，可自主完成代码生成、调试、重构，甚至能从零开发手机应用、构建C语言编译器，在真实软件工程场景中实用性极强。

2. 智能体能力：在BrowseComp（网页浏览测试）、MCP-Atlas（多步工具调用测试）等基准测试中表现优异，尤其在Vending Bench 2（长周期经营模拟测试）中，以4432美元的盈利额排名开源第一，展现出极强的自主规划、工具利用与长周期任务管理能力，可实现多智能体并行协作，大幅提升复杂任务的处理效率。

3. 综合推理与排名：在Artificial Analysis Intelligence Index v4.0榜单中，GLM 5以50分的成绩位居全球第四、开源模型第一，较上一代GLM 4.7的42分有显著提升；在LMSYS Chatbot Arena榜单中，其文本与代码两个核心维度双双登顶开源榜首，证明其在真实用户交互场景中的实用价值。

4.3 缺点与不足

尽管GLM 5表现出色，但仍存在一些真实短板，并非完美无缺：

1. 多模态能力缺失：由于其采用的DeepSeek-V3架构以纯文本为主，GLM 5首发版本未支持图像、音频等多模态输入输出，无法处理图文结合、语音转写等场景，与当前部分兼顾多模态的开源模型相比存在差距。

2. 高并发承载能力有限：上线初期因流量爆发出现限流、卡顿问题，虽经过优化有所改善，但在企业万级并发的生产场景中，仍可能出现响应延迟，中小微企业难以获得专属技术支持来解决高并发问题。

3. 特定场景存在幻觉：在处理一些冷门领域的专业知识、复杂数学证明的细节步骤时，偶尔会出现逻辑偏差或内容幻觉，虽不影响整体使用，但在高精度学术、科研场景中需谨慎验证。

4. 灰度开放机制不完善：上线初期按用户等级分阶段开放，导致部分Lite、Pro用户无法及时使用，且老用户升级机制粗糙，引发部分用户不满，虽智谱AI发布致歉信并提供退款渠道，但仍影响了部分用户体验。

五、重大事件

1. 匿名测试模型“Pony Alpha”爆火：2026年2月，GLM 5的测试版本以“Pony Alpha”之名匿名上线OpenRouter平台，凭借出色的编程与智能体能力，在全球开发者社区引发热议，有开发者用其从零开发手机应用、构建编译器，为GLM 5正式发布积累了大量关注度。

2. 正式发布引发资本市场轰动：2026年2月11日GLM 5正式发布后，智谱AI股价大幅上涨，两日暴涨60%，2月13日市值盘中最高触及496港元，总市值超过2100亿港元，创下上市以来新高，体现了资本市场对该模型的高度认可。

3. 智谱AI发布致歉信回应用户不满：2026年2月21日，智谱AI就GLM 5上线后的问题发布致歉信，承认存在规则透明度不足、灰度开放节奏过慢、老用户升级机制粗糙三大问题，明确按用户等级逐步开放，并支持受影响用户自主申请退款，及时化解了用户争议。

4. 开发者用其12小时开发游戏出圈：B站独立游戏开发者“夜神不说话”利用GLM 5调用多智能体架构，在12小时内完成了传统模式下2-3个月才能开发的游戏《逃离千禧年》，该游戏计划于3月中旬上线Steam平台，直观展现了GLM 5在降低开发成本、提升效率方面的优势，进一步扩大了模型的影响力。

5. 国产算力平台全面适配：GLM 5完成与华为昇腾、摩尔线程、寒武纪等国内主流国产算力平台的深度推理适配，在国产芯片集群上实现高吞吐、低延迟运行，推动国产大模型与国产算力的协同发展，提升了模型的国产化适配能力。

Question 2

GLM 5的API价格是多少？

Accepted Answer

GLM 5的API输入价格为4.7125元/百万Token，输出价格为15.0800元/百万Token。

Question 3

GLM 5支持哪些功能？

Accepted Answer

上下文窗口长度为200000

Question 4

GLM 5是国产模型吗？

Accepted Answer

是的，GLM 5是由Zhipu开发的国产AI大模型，可直接访问使用。

GLM 5

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

📊
能力雷达星图

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API

平台：OpenRouter 模型：GLM 5

⚡ 体验反馈与渠道测速

🤝 第三方测速反馈

⚔️
性能对标产品

Hy3 preview(high)

Qwen3.6-27B(Thinking)

MiMo V2.5 Pro Base

MiMo V2.5 Base

社区真实评价