GLM 5

GLM 5

glm-5

机构/公司
Zhipu(国内 🇨🇳)
发布日期
2026-02-12
版本状态
⭐ 当前主力
开源状态
🌍 开源可见
能力模态
💬 大语言模型
上下文长度
200K
参数规模:744B
主要语言:中文
底层架构:MoE
开源协议:MIT
官方计费模式:参见下方【使用模块】

📖
词条百科 Wiki

# 一、简介与定位

GLM 5是中国智谱AI于2026年2月11日发布的旗舰级开源大模型,核心定位为面向复杂系统工程与长程智能体任务的基座模型,主打编程、高阶推理与智能体自主协作能力。

其名称中“GLM”是“General Language Model”(通用语言模型)的缩写,无额外后缀,核心功能涵盖复杂代码生成与调试、多步逻辑推理、高质量创意写作、内置智能体架构及海量长上下文处理;官方使用门槛方面,个人开发者可免费试用基础功能,API接口提供新用户免费额度,高级功能需订阅付费套餐,且上线初期按Max、Pro、Lite用户等级分阶段开放;同期未发布同系列“兄弟模型”,但其与上一代GLM 4系列模型形成迭代衔接,共同完善智谱GLM家族生态。

目前GLM 5处于生命周期的活跃期,是智谱AI当前的主力旗舰模型,尚未被淘汰;其最突出的核心特点是采用混合专家架构,在开源大模型中实现编程与智能体能力的顶尖表现,可自主完成复杂工程任务,大幅降低开发门槛。

# 二、发展历程

# 2.1 研发背景

GLM 5发布前,行业内主流大模型呈现“闭源领跑、开源追赶”的格局,闭源领域有GPT-4o、Claude Opus 4.5、Gemini 3 Pro等,主打全能型性能但使用成本高、不开源;开源领域则有DeepSeek-V3、Llama 3等,虽门槛低但在复杂编程、长程智能体任务上存在明显短板。当时行业核心痛点集中在:开源模型难以支撑复杂软件工程,闭源模型成本过高且无法自主部署,同时大模型正从“被动问答”向“主动解决问题”进化,市场亟需一款能兼顾开源自由性与顶尖性能的基座模型,GLM 5正是在这样的行业局势下应运而生,聚焦填补开源模型在智能体与复杂编程领域的空白。

# 2.2 关键节点

2026年1月8日,智谱AI创立发起人兼首席科学家唐杰发布内部信,正式宣布计划推出新一代旗舰模型GLM 5,标志着该模型的研发进入收尾阶段。同年2月,全球模型服务平台OpenRouter上线一款代号为“Pony Alpha”的匿名模型,其出色的编程与智能体能力迅速引发全球开发者社区热议,据知情人士透露,该匿名模型正是GLM 5的测试版本。经过短暂的灰度测试与优化,2026年2月11日深夜,智谱AI正式对外发布GLM 5,同步开放部分API接口与开源权限,随后因流量爆发性增长,逐步推进不同等级用户的全面开放。

# 2.3 家族构成

GLM 5隶属于智谱AI GLM(通用语言模型)系列,该家族自推出以来,形成了覆盖不同性能、不同场景的模型矩阵,核心成员包括:

GLM 3系列:作为家族的基础款开源模型,定位为轻量型通用模型,参数量适中,主打中文处理与基础对话、简单代码生成,适配个人开发者与中小企业的轻量化需求,是GLM系列积累用户基础的核心模型。

GLM 4系列:上一代旗舰模型,分为多个版本,涵盖从基础版到Max版的梯度配置,在中文理解、逻辑推理上实现突破,首次引入多模态能力雏形,为GLM 5的混合专家架构与智能体能力奠定了技术基础,目前仍作为中低端场景的主力模型使用。

GLM 5:当前家族旗舰模型,定位为高阶开源基座模型,主打编程、智能体与长程推理,参数量与性能大幅提升,是家族中首个实现开源模型性能比肩顶尖闭源模型的产品,面向复杂工程场景与专业开发者。

# 三、核心技术剖析

# 3.1 固有技术

GLM 5继承了GLM系列模型的核心底层技术,首先延续了上一代模型的对齐手段,采用监督微调与强化学习结合的方式,确保模型输出的准确性与实用性,避免出现无意义的冗余内容;其次,继承了GLM系列对中文语境的深度优化,在中文语义理解、中文创意写作、中文代码注释等场景下,保持了家族一贯的优势;此外,其基础架构延续了GLM系列对开源生态的适配性,可直接兼容vLLM、SGLang等主流推理框架,降低开发者的部署成本,这也是GLM系列开源模型的核心竞争力之一。

# 3.2 创新技术

GLM 5的核心创新集中在架构与性能优化上,重点解决了开源模型在复杂任务处理、长文本效率、推理成本上的痛点,具体创新点如下:

1.  混合专家架构(MoE)升级:采用7450亿总参数量、440亿推理活跃参数的混合专家架构,包含256个专家,每次推理仅激活8个专家,稀疏度达5.9%。这种设计的核心优势的是“兼顾性能与成本”——总参数量提升保证了复杂任务处理能力,而仅激活部分专家则大幅降低了推理时的算力消耗,让开源模型也能支撑大规模工程任务。

2.  引入DeepSeek稀疏注意力机制(DSA):这是GLM 5提升长文本处理能力的关键技术,通过两阶段流程优化注意力计算:首先由轻量级组件快速扫描所有历史token并打分,筛选出与当前任务最相关的Top-k个token;再对筛选出的token进行完整的注意力计算,其余token直接跳过。这种方式既解决了传统注意力机制处理长文本时效率低、算力消耗大的问题,又能保证长上下文的保真度,让模型可轻松处理200K上下文窗口的海量信息。

3.  多Token预测(MTP)优化:在训练阶段共享3层MTP模块参数,在不增加显存开销的前提下,提升了推测解码的词元接受率,进而加快模型的生成速度。简单来说,就是让模型在生成内容时,能同时预测多个token,减少等待时间,尤其在代码生成、长篇写作等场景下,效率提升明显。

4.  异步解耦强化学习基础设施:构建了中心化的多任务Rollout编排器,将模型的推理(生成)与训练引擎在物理设备上解耦,彻底解决了长周期智能体任务中GPU空闲等待的问题,让模型能更高效地完成多步协作任务,比如自主规划软件开发流程、多步骤调试代码等。

# 四、表现评估

# 4.1 历史与现状

GLM 5刚发布时,凭借其匿名测试版本“Pony Alpha”的出圈表现,一经发布便引发全球开发者关注,迅速登顶开源模型排行榜,成为当时最受瞩目的国产开源大模型,打破了海外开源模型在高阶编程领域的垄断。截至2026年4月,GLM 5仍保持开源模型中的顶尖地位,虽面临部分新发布开源模型的竞争,但在编程、智能体领域的优势依然明显;同时,智谱AI持续优化模型性能,修复已知短板,完善API服务,其用户群体从个人开发者扩展到中小企业,甚至部分大型企业将其用于复杂工程辅助,市场认可度持续提升。

# 4.2 优势亮点

结合业内公认的排行榜数据与实际测试表现,GLM 5的优势主要集中在三个核心维度,表现突出:

1.  编程能力:在全球权威的SWE-bench-Verified(真实GitHub Issue解决能力测试)中取得77.8的开源模型最高分,在Terminal Bench 2.0(终端环境编码测试)中取得56.2的高分,编程能力对齐Claude Opus 4.5,性能超过Gemini 3 Pro,可自主完成代码生成、调试、重构,甚至能从零开发手机应用、构建C语言编译器,在真实软件工程场景中实用性极强。

2.  智能体能力:在BrowseComp(网页浏览测试)、MCP-Atlas(多步工具调用测试)等基准测试中表现优异,尤其在Vending Bench 2(长周期经营模拟测试)中,以4432美元的盈利额排名开源第一,展现出极强的自主规划、工具利用与长周期任务管理能力,可实现多智能体并行协作,大幅提升复杂任务的处理效率。

3.  综合推理与排名:在Artificial Analysis Intelligence Index v4.0榜单中,GLM 5以50分的成绩位居全球第四、开源模型第一,较上一代GLM 4.7的42分有显著提升;在LMSYS Chatbot Arena榜单中,其文本与代码两个核心维度双双登顶开源榜首,证明其在真实用户交互场景中的实用价值。

# 4.3 缺点与不足

尽管GLM 5表现出色,但仍存在一些真实短板,并非完美无缺:

1.  多模态能力缺失:由于其采用的DeepSeek-V3架构以纯文本为主,GLM 5首发版本未支持图像、音频等多模态输入输出,无法处理图文结合、语音转写等场景,与当前部分兼顾多模态的开源模型相比存在差距。

2.  高并发承载能力有限:上线初期因流量爆发出现限流、卡顿问题,虽经过优化有所改善,但在企业万级并发的生产场景中,仍可能出现响应延迟,中小微企业难以获得专属技术支持来解决高并发问题。

3.  特定场景存在幻觉:在处理一些冷门领域的专业知识、复杂数学证明的细节步骤时,偶尔会出现逻辑偏差或内容幻觉,虽不影响整体使用,但在高精度学术、科研场景中需谨慎验证。

4.  灰度开放机制不完善:上线初期按用户等级分阶段开放,导致部分Lite、Pro用户无法及时使用,且老用户升级机制粗糙,引发部分用户不满,虽智谱AI发布致歉信并提供退款渠道,但仍影响了部分用户体验。

# 五、重大事件

1.  匿名测试模型“Pony Alpha”爆火:2026年2月,GLM 5的测试版本以“Pony Alpha”之名匿名上线OpenRouter平台,凭借出色的编程与智能体能力,在全球开发者社区引发热议,有开发者用其从零开发手机应用、构建编译器,为GLM 5正式发布积累了大量关注度。

2.  正式发布引发资本市场轰动:2026年2月11日GLM 5正式发布后,智谱AI股价大幅上涨,两日暴涨60%,2月13日市值盘中最高触及496港元,总市值超过2100亿港元,创下上市以来新高,体现了资本市场对该模型的高度认可。

3.  智谱AI发布致歉信回应用户不满:2026年2月21日,智谱AI就GLM 5上线后的问题发布致歉信,承认存在规则透明度不足、灰度开放节奏过慢、老用户升级机制粗糙三大问题,明确按用户等级逐步开放,并支持受影响用户自主申请退款,及时化解了用户争议。

4.  开发者用其12小时开发游戏出圈:B站独立游戏开发者“夜神不说话”利用GLM 5调用多智能体架构,在12小时内完成了传统模式下2-3个月才能开发的游戏《逃离千禧年》,该游戏计划于3月中旬上线Steam平台,直观展现了GLM 5在降低开发成本、提升效率方面的优势,进一步扩大了模型的影响力。

5.  国产算力平台全面适配:GLM 5完成与华为昇腾、摩尔线程、寒武纪等国内主流国产算力平台的深度推理适配,在国产芯片集群上实现高吞吐、低延迟运行,推动国产大模型与国产算力的协同发展,提升了模型的国产化适配能力。

由本站联合社区极客共同编撰,最后更新:2026-05-21 17:12:03
开放 Wiki 模式开启中

📊
能力雷达星图

权威基准

模型家族构成

🔗 相关链接

词条待补全

没有找到体验地址?去反馈!

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API
API价格
实时更新
平台:OpenRouter 模型:GLM 5
输入(/1M)4.71
输出(/1M)15.08
价格由固定汇率换算而来,可能存在细微差距。

体验反馈与渠道测速

🤝 第三方测速反馈
🔌
平台:OpenRouter
模型:GLM 5
状态:暂无反馈0 票
前往直达

⚔️
性能对标产品

AI

Hy3 preview(high)

Unknown
Qwen3.6-27B(Thinking)

Qwen3.6-27B(Thinking)

Qwen
MiMo V2.5 Pro Base

MiMo V2.5 Pro Base

Xiaomi
MiMo V2.5 Base

MiMo V2.5 Base

Xiaomi
💬

社区真实评价

🤐

登录后才能发表评价,与极客们一起交流哦~

正在拉取评论数据...