# 一、简介与定位
GLM 5是中国智谱AI于2026年2月11日发布的旗舰级开源大模型,核心定位为面向复杂系统工程与长程智能体任务的基座模型,主打编程、高阶推理与智能体自主协作能力。
其名称中“GLM”是“General Language Model”(通用语言模型)的缩写,无额外后缀,核心功能涵盖复杂代码生成与调试、多步逻辑推理、高质量创意写作、内置智能体架构及海量长上下文处理;官方使用门槛方面,个人开发者可免费试用基础功能,API接口提供新用户免费额度,高级功能需订阅付费套餐,且上线初期按Max、Pro、Lite用户等级分阶段开放;同期未发布同系列“兄弟模型”,但其与上一代GLM 4系列模型形成迭代衔接,共同完善智谱GLM家族生态。
目前GLM 5处于生命周期的活跃期,是智谱AI当前的主力旗舰模型,尚未被淘汰;其最突出的核心特点是采用混合专家架构,在开源大模型中实现编程与智能体能力的顶尖表现,可自主完成复杂工程任务,大幅降低开发门槛。
# 二、发展历程
# 2.1 研发背景
GLM 5发布前,行业内主流大模型呈现“闭源领跑、开源追赶”的格局,闭源领域有GPT-4o、Claude Opus 4.5、Gemini 3 Pro等,主打全能型性能但使用成本高、不开源;开源领域则有DeepSeek-V3、Llama 3等,虽门槛低但在复杂编程、长程智能体任务上存在明显短板。当时行业核心痛点集中在:开源模型难以支撑复杂软件工程,闭源模型成本过高且无法自主部署,同时大模型正从“被动问答”向“主动解决问题”进化,市场亟需一款能兼顾开源自由性与顶尖性能的基座模型,GLM 5正是在这样的行业局势下应运而生,聚焦填补开源模型在智能体与复杂编程领域的空白。
# 2.2 关键节点
2026年1月8日,智谱AI创立发起人兼首席科学家唐杰发布内部信,正式宣布计划推出新一代旗舰模型GLM 5,标志着该模型的研发进入收尾阶段。同年2月,全球模型服务平台OpenRouter上线一款代号为“Pony Alpha”的匿名模型,其出色的编程与智能体能力迅速引发全球开发者社区热议,据知情人士透露,该匿名模型正是GLM 5的测试版本。经过短暂的灰度测试与优化,2026年2月11日深夜,智谱AI正式对外发布GLM 5,同步开放部分API接口与开源权限,随后因流量爆发性增长,逐步推进不同等级用户的全面开放。
# 2.3 家族构成
GLM 5隶属于智谱AI GLM(通用语言模型)系列,该家族自推出以来,形成了覆盖不同性能、不同场景的模型矩阵,核心成员包括:
GLM 3系列:作为家族的基础款开源模型,定位为轻量型通用模型,参数量适中,主打中文处理与基础对话、简单代码生成,适配个人开发者与中小企业的轻量化需求,是GLM系列积累用户基础的核心模型。
GLM 4系列:上一代旗舰模型,分为多个版本,涵盖从基础版到Max版的梯度配置,在中文理解、逻辑推理上实现突破,首次引入多模态能力雏形,为GLM 5的混合专家架构与智能体能力奠定了技术基础,目前仍作为中低端场景的主力模型使用。
GLM 5:当前家族旗舰模型,定位为高阶开源基座模型,主打编程、智能体与长程推理,参数量与性能大幅提升,是家族中首个实现开源模型性能比肩顶尖闭源模型的产品,面向复杂工程场景与专业开发者。
# 三、核心技术剖析
# 3.1 固有技术
GLM 5继承了GLM系列模型的核心底层技术,首先延续了上一代模型的对齐手段,采用监督微调与强化学习结合的方式,确保模型输出的准确性与实用性,避免出现无意义的冗余内容;其次,继承了GLM系列对中文语境的深度优化,在中文语义理解、中文创意写作、中文代码注释等场景下,保持了家族一贯的优势;此外,其基础架构延续了GLM系列对开源生态的适配性,可直接兼容vLLM、SGLang等主流推理框架,降低开发者的部署成本,这也是GLM系列开源模型的核心竞争力之一。
# 3.2 创新技术
GLM 5的核心创新集中在架构与性能优化上,重点解决了开源模型在复杂任务处理、长文本效率、推理成本上的痛点,具体创新点如下:
1. 混合专家架构(MoE)升级:采用7450亿总参数量、440亿推理活跃参数的混合专家架构,包含256个专家,每次推理仅激活8个专家,稀疏度达5.9%。这种设计的核心优势的是“兼顾性能与成本”——总参数量提升保证了复杂任务处理能力,而仅激活部分专家则大幅降低了推理时的算力消耗,让开源模型也能支撑大规模工程任务。
2. 引入DeepSeek稀疏注意力机制(DSA):这是GLM 5提升长文本处理能力的关键技术,通过两阶段流程优化注意力计算:首先由轻量级组件快速扫描所有历史token并打分,筛选出与当前任务最相关的Top-k个token;再对筛选出的token进行完整的注意力计算,其余token直接跳过。这种方式既解决了传统注意力机制处理长文本时效率低、算力消耗大的问题,又能保证长上下文的保真度,让模型可轻松处理200K上下文窗口的海量信息。
3. 多Token预测(MTP)优化:在训练阶段共享3层MTP模块参数,在不增加显存开销的前提下,提升了推测解码的词元接受率,进而加快模型的生成速度。简单来说,就是让模型在生成内容时,能同时预测多个token,减少等待时间,尤其在代码生成、长篇写作等场景下,效率提升明显。
4. 异步解耦强化学习基础设施:构建了中心化的多任务Rollout编排器,将模型的推理(生成)与训练引擎在物理设备上解耦,彻底解决了长周期智能体任务中GPU空闲等待的问题,让模型能更高效地完成多步协作任务,比如自主规划软件开发流程、多步骤调试代码等。
# 四、表现评估
# 4.1 历史与现状
GLM 5刚发布时,凭借其匿名测试版本“Pony Alpha”的出圈表现,一经发布便引发全球开发者关注,迅速登顶开源模型排行榜,成为当时最受瞩目的国产开源大模型,打破了海外开源模型在高阶编程领域的垄断。截至2026年4月,GLM 5仍保持开源模型中的顶尖地位,虽面临部分新发布开源模型的竞争,但在编程、智能体领域的优势依然明显;同时,智谱AI持续优化模型性能,修复已知短板,完善API服务,其用户群体从个人开发者扩展到中小企业,甚至部分大型企业将其用于复杂工程辅助,市场认可度持续提升。
# 4.2 优势亮点
结合业内公认的排行榜数据与实际测试表现,GLM 5的优势主要集中在三个核心维度,表现突出:
1. 编程能力:在全球权威的SWE-bench-Verified(真实GitHub Issue解决能力测试)中取得77.8的开源模型最高分,在Terminal Bench 2.0(终端环境编码测试)中取得56.2的高分,编程能力对齐Claude Opus 4.5,性能超过Gemini 3 Pro,可自主完成代码生成、调试、重构,甚至能从零开发手机应用、构建C语言编译器,在真实软件工程场景中实用性极强。
2. 智能体能力:在BrowseComp(网页浏览测试)、MCP-Atlas(多步工具调用测试)等基准测试中表现优异,尤其在Vending Bench 2(长周期经营模拟测试)中,以4432美元的盈利额排名开源第一,展现出极强的自主规划、工具利用与长周期任务管理能力,可实现多智能体并行协作,大幅提升复杂任务的处理效率。
3. 综合推理与排名:在Artificial Analysis Intelligence Index v4.0榜单中,GLM 5以50分的成绩位居全球第四、开源模型第一,较上一代GLM 4.7的42分有显著提升;在LMSYS Chatbot Arena榜单中,其文本与代码两个核心维度双双登顶开源榜首,证明其在真实用户交互场景中的实用价值。
# 4.3 缺点与不足
尽管GLM 5表现出色,但仍存在一些真实短板,并非完美无缺:
1. 多模态能力缺失:由于其采用的DeepSeek-V3架构以纯文本为主,GLM 5首发版本未支持图像、音频等多模态输入输出,无法处理图文结合、语音转写等场景,与当前部分兼顾多模态的开源模型相比存在差距。
2. 高并发承载能力有限:上线初期因流量爆发出现限流、卡顿问题,虽经过优化有所改善,但在企业万级并发的生产场景中,仍可能出现响应延迟,中小微企业难以获得专属技术支持来解决高并发问题。
3. 特定场景存在幻觉:在处理一些冷门领域的专业知识、复杂数学证明的细节步骤时,偶尔会出现逻辑偏差或内容幻觉,虽不影响整体使用,但在高精度学术、科研场景中需谨慎验证。
4. 灰度开放机制不完善:上线初期按用户等级分阶段开放,导致部分Lite、Pro用户无法及时使用,且老用户升级机制粗糙,引发部分用户不满,虽智谱AI发布致歉信并提供退款渠道,但仍影响了部分用户体验。
# 五、重大事件
1. 匿名测试模型“Pony Alpha”爆火:2026年2月,GLM 5的测试版本以“Pony Alpha”之名匿名上线OpenRouter平台,凭借出色的编程与智能体能力,在全球开发者社区引发热议,有开发者用其从零开发手机应用、构建编译器,为GLM 5正式发布积累了大量关注度。
2. 正式发布引发资本市场轰动:2026年2月11日GLM 5正式发布后,智谱AI股价大幅上涨,两日暴涨60%,2月13日市值盘中最高触及496港元,总市值超过2100亿港元,创下上市以来新高,体现了资本市场对该模型的高度认可。
3. 智谱AI发布致歉信回应用户不满:2026年2月21日,智谱AI就GLM 5上线后的问题发布致歉信,承认存在规则透明度不足、灰度开放节奏过慢、老用户升级机制粗糙三大问题,明确按用户等级逐步开放,并支持受影响用户自主申请退款,及时化解了用户争议。
4. 开发者用其12小时开发游戏出圈:B站独立游戏开发者“夜神不说话”利用GLM 5调用多智能体架构,在12小时内完成了传统模式下2-3个月才能开发的游戏《逃离千禧年》,该游戏计划于3月中旬上线Steam平台,直观展现了GLM 5在降低开发成本、提升效率方面的优势,进一步扩大了模型的影响力。
5. 国产算力平台全面适配:GLM 5完成与华为昇腾、摩尔线程、寒武纪等国内主流国产算力平台的深度推理适配,在国产芯片集群上实现高吞吐、低延迟运行,推动国产大模型与国产算力的协同发展,提升了模型的国产化适配能力。
社区真实评价
登录后才能发表评价,与极客们一起交流哦~