GLM 4.5

GLM 4.5

glm-4-5

机构/公司
Zhipu(国内 🇨🇳)
发布日期
未披露
版本状态
⭐ 当前主力
开源状态
🌍 开源可见
能力模态
💬 大语言模型
上下文长度
未知
参数规模:暂未收录
主要语言:暂未收录
底层架构:暂未收录
开源协议:暂未收录
官方计费模式:参见下方【使用模块】

📖
词条百科 Wiki

# 一、简介与定位

GLM 4.5是中国智谱AI于2025年7月28日发布的开源旗舰级大模型,核心定位为原生智能体能力融合的基础模型,主打推理、编码与智能体能力的三位一体。

其名称中“GLM”是“General Language Model”(通用语言模型)的缩写,后缀“4.5”代表其为GLM 4系列的迭代升级版本,区别于前代的核心是能力融合而非单纯参数提升;核心功能涵盖128k长上下文处理、原生函数调用、全栈开发支持等,官方使用门槛极低,个人用户可免费试用,新注册用户可获取合计400万token的API免费额度,API调用定价低至输入0.8元/百万tokens、输出2元/百万tokens,无强制订阅要求,仅部分高级商用功能需付费;同期发布的兄弟模型为轻量版GLM 4.5-Air,主打轻量化部署,适配低算力场景。

目前GLM 4.5仍处于生命周期中的主力阶段,尚未被后续迭代模型淘汰,是智谱AI开源生态的核心产品,其最突出的核心特点是在参数效率更优的前提下,实现了推理、编码与智能体能力的原生融合,无需依赖第三方插件即可完成复杂任务调度。

# 二、发展历程

# 2.1 研发背景

GLM 4.5发布前,全球大模型领域已形成“专有模型领跑、开源模型追赶”的格局,主流模型主要分为三类:一是OpenAI的GPT系列(如GPT-4o)、Anthropic的Claude系列,擅长推理与代码,但多为闭源且使用成本高昂;二是国产闭源模型如通义千问、文心一言,中文处理能力较强,但在智能体融合能力上存在短板;三是其他开源模型如Llama 3、DeepSeek-R1,虽开源可定制,但普遍存在“偏科”问题,难以同时兼顾推理、编码与智能体能力。当时行业的核心痛点的是,多数模型仍以单一能力为核心,无法满足用户在实际场景中对“多能力协同”的需求,智谱AI基于这一行业现状,启动了GLM 4.5的研发,致力于打造一款“全优生”开源模型,打破能力割裂的困境。

# 2.2 关键节点

GLM 4.5的研发始于2024年底,智谱AI在GLM 4的基础上,确立了“原生能力融合”的研发方向,重点投入智能体架构与多任务训练的技术攻关;2025年上半年,模型进入内部内测阶段,邀请科研机构与企业开发者参与测试,重点优化长上下文处理与工具调用的稳定性,期间根据反馈调整了MoE架构的路由机制;2025年7月中旬,模型完成最终优化,通过多项权威基准测试,确定发布时间;2025年7月28日晚间,智谱AI正式对外发布GLM 4.5,同步开源于Hugging Face与Model Scope平台,并公布技术细节;发布后一个月内,持续迭代优化API响应速度与任务适配性,完善开发者生态。

# 2.3 家族构成

GLM 4.5隶属于智谱AI的GLM系列大模型,该系列自推出以来,形成了覆盖旗舰、轻量、专用的完整产品矩阵,核心成员包括:

GLM 3系列:作为GLM系列的前代主力,包括GLM 3-40B、GLM 3-Turbo等版本,主打通用语言理解与生成,奠定了GLM系列的基座架构,是GLM 4.5的技术基础,目前仍用于中低复杂度的文本处理场景。

GLM 4系列:GLM 4.5的前代旗舰,分为闭源版与开源版,重点提升了推理与代码能力,但未实现能力的原生融合,是GLM 4.5迭代的直接基础,目前已逐步被GLM 4.5替代,但仍在部分存量系统中使用。

GLM 4.5:系列当前旗舰开源模型,主打推理、编码与智能体能力原生融合,是目前GLM系列的核心产品,面向开发者与企业用户,提供高参数效率与高通用性。

GLM 4.5-Air:GLM 4.5的轻量版,总参数1060亿、激活参数120亿,主打轻量化部署,适配边缘设备与低算力场景,能力上略逊于GLM 4.5,但部署成本更低,满足中小开发者的轻量化需求。

CodeGeeX-4:GLM系列的专用代码大模型,专注于代码生成、修复与调试,与GLM 4.5的编码能力形成互补,面向专业开发者提供针对性的代码服务。

AutoGLM:GLM系列的智能体专用模型,专注于工具调度与任务规划,为GLM 4.5的智能体能力提供了技术支撑,目前已整合到GLM 4.5的原生架构中。

# 三、核心技术剖析

# 3.1 固有技术

GLM 4.5继承了GLM系列基座模型的核心技术,底层架构基于Transformer改进而来,沿用了GLM 4的MoE(混合专家)架构基础,通过稀疏激活机制实现算力与性能的平衡,避免了稠密架构算力消耗过高的问题;同时继承了前代模型的对齐手段,采用“预训练+监督微调+强化学习”的三段式训练流程,确保模型输出的准确性与安全性;此外,还延续了GLM系列对中文语料的优化处理,保留了中文理解与生成的优势,无需额外微调即可适配中文场景。

# 3.2 创新技术

GLM 4.5的核心创新点集中在能力融合与技术优化上,重点解决了前代模型“偏科”、长文本处理效率低、工具调用不稳定等问题,具体如下:

1.  原生智能体能力融合:这是GLM 4.5最核心的创新,区别于传统模型通过prompt组合实现智能体功能的方式,GLM 4.5在模型结构中直接完成推理、编码与智能体能力的融合训练,无需依赖第三方插件,即可实现工具调度、任务规划与结果生成的一体化,工具调用成功率高达90.6%,能直接调度浏览器、代码执行器等外部工具完成复杂任务。

2.  优化的MoE架构设计:采用“瘦高”模型结构,减少模型宽度(隐藏维度与路由专家数量)、增加模型深度,同时引入loss-free balance路由与sigmoid gate技术,解决了传统MoE架构专家负载不均的问题,在提升推理能力的同时,保证了推理效率,其3550亿总参数(320亿激活参数)的配置,实现了参数效率的最优平衡。

3.  注意力机制升级:采用分组查询注意力(GQA)结合部分旋转位置编码(partial RoPE),将注意力头数量提升至96个(是普通模型的2.5倍),既解决了长文本处理中的遗忘问题,又提升了推理任务的准确性,同时支持128k长上下文窗口,能轻松处理超长文档、代码仓库等复杂内容。

4.  训练优化技术创新:引入Muon优化器替代传统AdamW优化器,加快模型收敛速度,同时支持更大的Batch Size,提升训练效率;采用QK-Norm技术提升注意力logit的数值稳定性,避免训练过程中出现数值异常;加入Multi Token Prediction(MTP)机制,实现推测解码,大幅提升推理生成速度。

5.  专用强化学习框架:配套开源了slime强化学习框架,专为大模型智能体训练设计,支持异步环境收集与并行训练,通过解耦训练与交互流程,提升数据吞吐与GPU利用效率,同时采用FP8推理+BF16训练的混合精度模式,进一步提升训练与推理效率。

# 四、表现评估

# 4.1 历史与现状

GLM 4.5刚发布时,凭借“全球第三、国产第一、开源第一”的综合评测成绩,迅速在AI圈出圈,打破了国外闭源模型在高端领域的垄断,成为当时开源模型中的标杆产品,发布当晚官方推文浏览量突破120万,连续7天登顶Hugging Face趋势榜单;截至2026年4月,GLM 4.5仍是智谱AI的主力开源模型,虽面临Llama 4、Qwen 4等新模型的竞争,但凭借其原生智能体融合能力与高参数效率,仍在开源领域保持领先地位,开发者生态持续完善,已有多款应用接入该模型。

# 4.2 优势亮点

结合LMSYS Chatbot Arena、SuperCLUE、MMLU Pro、AIME 24等业内公认的排行榜与评测数据,GLM 4.5的优势主要集中在三个核心维度,表现突出:

1.  智能体能力领先:在τ-Bench、BFCL、BrowseComp等4项主流Agent基准测试中均处于第一梯队,其中在网页浏览类Agent基准BrowseComp上,准确率达26.4%,远超Claude-4-Opus(18.8%),逼近GPT-4o(28.3%),在网页理解、内容提取、行为执行等一体化任务中表现优异,且算力-性能比更优,相同推理资源投入下能获得更高准确率。

2.  编码能力出众:在SWE-bench Verified任务中得分为64.2,位列开源模型前列,仅次于Claude-4系列、o3与Kimi K2,优于GPT-4.1,具备强大的代码理解、修复与全栈开发能力;在Terminal-Bench测试中,超过GPT-4.1与Claude-4 Sonnet,在实际工程指令链处理上表现均衡,可独立完成HTML5小游戏、TODO看板、SVG动画等开发任务。

3.  推理能力稳定:在AIME、GPQA、HLE等复杂推理基准测试中表现稳定,综合推理能力位列开源模型第二,能高效处理多步骤数学题、科学问题等复杂推理任务,同时得益于128k长上下文窗口,在长文本推理、跨文档关联分析等场景中,优势明显,不易出现逻辑断裂。

此外,GLM 4.5的参数效率极高,参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,但综合性能却实现反超,部署成本更低,适配更多中小开发者与企业场景。

# 4.3 缺点与不足

尽管GLM 4.5表现出色,但仍存在一些真实短板,并非完美无缺:

1.  专业领域深度不足:在金融、医疗等高度专业的领域,错误率相对较高,缺乏针对性的专业训练,无法替代专业人员的判断,仅能作为辅助工具使用。

2.  创意生成能力有限:相比专门的创意类大模型,GLM 4.5在文学创作、艺术构思等场景中,输出的内容缺乏新意,同质化较为明显,且对抽象创意的理解能力不足。

3.  长文本细节把控不足:虽然支持128k长上下文,但在处理超长篇文档(如百万字小说、大型代码仓库)时,仍会出现细节丢失、逻辑衔接不畅的问题,尾部内容的关联性会有所下降。

4.  多模态能力缺失:GLM 4.5仅支持文本模态,不具备图像、语音等多模态处理能力,无法满足图文生成、语音交互等多模态场景需求,与当前多模态通才模型的发展趋势存在差距。

# 五、重大事件

1.  2025年7月28日,GLM 4.5正式发布并同步开源,发布当晚即刷屏社交网络,官方推文浏览量突破120万,连续7天登顶Hugging Face趋势榜单,引发海内外AI圈热议,成为当时最受关注的开源大模型。

2.  2025年8月,GLM 4.5技术报告正式发布,详细披露了预训练、中期训练与强化学习的核心细节,被Hugging Face用户投票为当日“#1 Paper of the day”,受到学术界与工业界的广泛关注,为开源模型的研发提供了重要参考。

3.  2025年9月,GLM 4.5被开发者用于搭建“Claude Code+GLM 4.5”组合方案,成为国外模型的国内平替方案,在掘金等开发者社区广泛传播,进一步扩大了其在开发者群体中的影响力,推动了开源生态的完善。

4.  2025年7月至8月,Rokid Glasses、智联招聘、脉脉、沉浸式翻译等多家企业宣布接入GLM 4.5,推动模型从技术研发走向实际应用,覆盖智能硬件、招聘、翻译等多个场景,验证了其商业价值。

5.  2025年8月,GLM 4.5与OpenAI开源的gpt-oss系列模型展开正面比拼,其综合表现依旧领先,进一步巩固了其在开源模型中的领先地位,也引发了业内对“开源与闭源模型发展路径”的讨论。

由本站联合社区极客共同编撰,最后更新:2026-05-03 18:04:08
开放 Wiki 模式开启中

📊
能力雷达星图

权威基准

模型家族构成

🔗 相关链接

词条待补全

没有找到体验地址?去反馈!

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API
API价格
实时更新
平台:OpenRouter 模型:GLM 4.5
输入(/1M)4.35
输出(/1M)15.95
价格由固定汇率换算而来,可能存在细微差距。
API价格
实时更新
平台:SiliconFlow 🚫[已下架] 模型:GLM-4.5
输入(/1M)3.50
输出(/1M)14.00
⚠️ [已停止服务] 自动同步官方价格

体验反馈与渠道测速

🏛️ 官方渠道体验
SiliconFlow 官方
已下架
状态:⛔ 停止服务 / API失效
不可用
🤝 第三方测速反馈
🔌
平台:SiliconFlow 🚫[已下架]
模型:GLM-4.5
状态:暂无反馈0 票
前往直达
🔌
平台:OpenRouter
模型:GLM 4.5
状态:暂无反馈0 票
前往直达

⚔️
性能对标产品

AI

Hy3 preview(high)

Unknown
Qwen3.6-27B(Thinking)

Qwen3.6-27B(Thinking)

Qwen
MiMo V2.5 Pro Base

MiMo V2.5 Pro Base

Xiaomi
MiMo V2.5 Base

MiMo V2.5 Base

Xiaomi
💬

社区真实评价

🤐

登录后才能发表评价,与极客们一起交流哦~

正在拉取评论数据...