Name: GLM 4.5
Rating: 97 (1 reviews)
Author: Zhipu

Question 1

GLM 4.5是什么？

Accepted Answer

一、简介与定位

GLM 4.5是中国智谱AI于2025年7月28日发布的开源旗舰级大模型，核心定位为原生智能体能力融合的基础模型，主打推理、编码与智能体能力的三位一体。

其名称中“GLM”是“General Language Model”（通用语言模型）的缩写，后缀“4.5”代表其为GLM 4系列的迭代升级版本，区别于前代的核心是能力融合而非单纯参数提升；核心功能涵盖128k长上下文处理、原生函数调用、全栈开发支持等，官方使用门槛极低，个人用户可免费试用，新注册用户可获取合计400万token的API免费额度，API调用定价低至输入0.8元/百万tokens、输出2元/百万tokens，无强制订阅要求，仅部分高级商用功能需付费；同期发布的兄弟模型为轻量版GLM 4.5-Air，主打轻量化部署，适配低算力场景。

目前GLM 4.5仍处于生命周期中的主力阶段，尚未被后续迭代模型淘汰，是智谱AI开源生态的核心产品，其最突出的核心特点是在参数效率更优的前提下，实现了推理、编码与智能体能力的原生融合，无需依赖第三方插件即可完成复杂任务调度。

二、发展历程

2.1 研发背景

GLM 4.5发布前，全球大模型领域已形成“专有模型领跑、开源模型追赶”的格局，主流模型主要分为三类：一是OpenAI的GPT系列（如GPT-4o）、Anthropic的Claude系列，擅长推理与代码，但多为闭源且使用成本高昂；二是国产闭源模型如通义千问、文心一言，中文处理能力较强，但在智能体融合能力上存在短板；三是其他开源模型如Llama 3、DeepSeek-R1，虽开源可定制，但普遍存在“偏科”问题，难以同时兼顾推理、编码与智能体能力。当时行业的核心痛点的是，多数模型仍以单一能力为核心，无法满足用户在实际场景中对“多能力协同”的需求，智谱AI基于这一行业现状，启动了GLM 4.5的研发，致力于打造一款“全优生”开源模型，打破能力割裂的困境。

2.2 关键节点

GLM 4.5的研发始于2024年底，智谱AI在GLM 4的基础上，确立了“原生能力融合”的研发方向，重点投入智能体架构与多任务训练的技术攻关；2025年上半年，模型进入内部内测阶段，邀请科研机构与企业开发者参与测试，重点优化长上下文处理与工具调用的稳定性，期间根据反馈调整了MoE架构的路由机制；2025年7月中旬，模型完成最终优化，通过多项权威基准测试，确定发布时间；2025年7月28日晚间，智谱AI正式对外发布GLM 4.5，同步开源于Hugging Face与Model Scope平台，并公布技术细节；发布后一个月内，持续迭代优化API响应速度与任务适配性，完善开发者生态。

2.3 家族构成

GLM 4.5隶属于智谱AI的GLM系列大模型，该系列自推出以来，形成了覆盖旗舰、轻量、专用的完整产品矩阵，核心成员包括：

GLM 3系列：作为GLM系列的前代主力，包括GLM 3-40B、GLM 3-Turbo等版本，主打通用语言理解与生成，奠定了GLM系列的基座架构，是GLM 4.5的技术基础，目前仍用于中低复杂度的文本处理场景。

GLM 4系列：GLM 4.5的前代旗舰，分为闭源版与开源版，重点提升了推理与代码能力，但未实现能力的原生融合，是GLM 4.5迭代的直接基础，目前已逐步被GLM 4.5替代，但仍在部分存量系统中使用。

GLM 4.5：系列当前旗舰开源模型，主打推理、编码与智能体能力原生融合，是目前GLM系列的核心产品，面向开发者与企业用户，提供高参数效率与高通用性。

GLM 4.5-Air：GLM 4.5的轻量版，总参数1060亿、激活参数120亿，主打轻量化部署，适配边缘设备与低算力场景，能力上略逊于GLM 4.5，但部署成本更低，满足中小开发者的轻量化需求。

CodeGeeX-4：GLM系列的专用代码大模型，专注于代码生成、修复与调试，与GLM 4.5的编码能力形成互补，面向专业开发者提供针对性的代码服务。

AutoGLM：GLM系列的智能体专用模型，专注于工具调度与任务规划，为GLM 4.5的智能体能力提供了技术支撑，目前已整合到GLM 4.5的原生架构中。

三、核心技术剖析

3.1 固有技术

GLM 4.5继承了GLM系列基座模型的核心技术，底层架构基于Transformer改进而来，沿用了GLM 4的MoE（混合专家）架构基础，通过稀疏激活机制实现算力与性能的平衡，避免了稠密架构算力消耗过高的问题；同时继承了前代模型的对齐手段，采用“预训练+监督微调+强化学习”的三段式训练流程，确保模型输出的准确性与安全性；此外，还延续了GLM系列对中文语料的优化处理，保留了中文理解与生成的优势，无需额外微调即可适配中文场景。

3.2 创新技术

GLM 4.5的核心创新点集中在能力融合与技术优化上，重点解决了前代模型“偏科”、长文本处理效率低、工具调用不稳定等问题，具体如下：

1. 原生智能体能力融合：这是GLM 4.5最核心的创新，区别于传统模型通过prompt组合实现智能体功能的方式，GLM 4.5在模型结构中直接完成推理、编码与智能体能力的融合训练，无需依赖第三方插件，即可实现工具调度、任务规划与结果生成的一体化，工具调用成功率高达90.6%，能直接调度浏览器、代码执行器等外部工具完成复杂任务。

2. 优化的MoE架构设计：采用“瘦高”模型结构，减少模型宽度（隐藏维度与路由专家数量）、增加模型深度，同时引入loss-free balance路由与sigmoid gate技术，解决了传统MoE架构专家负载不均的问题，在提升推理能力的同时，保证了推理效率，其3550亿总参数（320亿激活参数）的配置，实现了参数效率的最优平衡。

3. 注意力机制升级：采用分组查询注意力（GQA）结合部分旋转位置编码（partial RoPE），将注意力头数量提升至96个（是普通模型的2.5倍），既解决了长文本处理中的遗忘问题，又提升了推理任务的准确性，同时支持128k长上下文窗口，能轻松处理超长文档、代码仓库等复杂内容。

4. 训练优化技术创新：引入Muon优化器替代传统AdamW优化器，加快模型收敛速度，同时支持更大的Batch Size，提升训练效率；采用QK-Norm技术提升注意力logit的数值稳定性，避免训练过程中出现数值异常；加入Multi Token Prediction（MTP）机制，实现推测解码，大幅提升推理生成速度。

5. 专用强化学习框架：配套开源了slime强化学习框架，专为大模型智能体训练设计，支持异步环境收集与并行训练，通过解耦训练与交互流程，提升数据吞吐与GPU利用效率，同时采用FP8推理+BF16训练的混合精度模式，进一步提升训练与推理效率。

四、表现评估

4.1 历史与现状

GLM 4.5刚发布时，凭借“全球第三、国产第一、开源第一”的综合评测成绩，迅速在AI圈出圈，打破了国外闭源模型在高端领域的垄断，成为当时开源模型中的标杆产品，发布当晚官方推文浏览量突破120万，连续7天登顶Hugging Face趋势榜单；截至2026年4月，GLM 4.5仍是智谱AI的主力开源模型，虽面临Llama 4、Qwen 4等新模型的竞争，但凭借其原生智能体融合能力与高参数效率，仍在开源领域保持领先地位，开发者生态持续完善，已有多款应用接入该模型。

4.2 优势亮点

结合LMSYS Chatbot Arena、SuperCLUE、MMLU Pro、AIME 24等业内公认的排行榜与评测数据，GLM 4.5的优势主要集中在三个核心维度，表现突出：

1. 智能体能力领先：在τ-Bench、BFCL、BrowseComp等4项主流Agent基准测试中均处于第一梯队，其中在网页浏览类Agent基准BrowseComp上，准确率达26.4%，远超Claude-4-Opus（18.8%），逼近GPT-4o（28.3%），在网页理解、内容提取、行为执行等一体化任务中表现优异，且算力-性能比更优，相同推理资源投入下能获得更高准确率。

2. 编码能力出众：在SWE-bench Verified任务中得分为64.2，位列开源模型前列，仅次于Claude-4系列、o3与Kimi K2，优于GPT-4.1，具备强大的代码理解、修复与全栈开发能力；在Terminal-Bench测试中，超过GPT-4.1与Claude-4 Sonnet，在实际工程指令链处理上表现均衡，可独立完成HTML5小游戏、TODO看板、SVG动画等开发任务。

3. 推理能力稳定：在AIME、GPQA、HLE等复杂推理基准测试中表现稳定，综合推理能力位列开源模型第二，能高效处理多步骤数学题、科学问题等复杂推理任务，同时得益于128k长上下文窗口，在长文本推理、跨文档关联分析等场景中，优势明显，不易出现逻辑断裂。

此外，GLM 4.5的参数效率极高，参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3，但综合性能却实现反超，部署成本更低，适配更多中小开发者与企业场景。

4.3 缺点与不足

尽管GLM 4.5表现出色，但仍存在一些真实短板，并非完美无缺：

1. 专业领域深度不足：在金融、医疗等高度专业的领域，错误率相对较高，缺乏针对性的专业训练，无法替代专业人员的判断，仅能作为辅助工具使用。

2. 创意生成能力有限：相比专门的创意类大模型，GLM 4.5在文学创作、艺术构思等场景中，输出的内容缺乏新意，同质化较为明显，且对抽象创意的理解能力不足。

3. 长文本细节把控不足：虽然支持128k长上下文，但在处理超长篇文档（如百万字小说、大型代码仓库）时，仍会出现细节丢失、逻辑衔接不畅的问题，尾部内容的关联性会有所下降。

4. 多模态能力缺失：GLM 4.5仅支持文本模态，不具备图像、语音等多模态处理能力，无法满足图文生成、语音交互等多模态场景需求，与当前多模态通才模型的发展趋势存在差距。

五、重大事件

1. 2025年7月28日，GLM 4.5正式发布并同步开源，发布当晚即刷屏社交网络，官方推文浏览量突破120万，连续7天登顶Hugging Face趋势榜单，引发海内外AI圈热议，成为当时最受关注的开源大模型。

2. 2025年8月，GLM 4.5技术报告正式发布，详细披露了预训练、中期训练与强化学习的核心细节，被Hugging Face用户投票为当日“#1 Paper of the day”，受到学术界与工业界的广泛关注，为开源模型的研发提供了重要参考。

3. 2025年9月，GLM 4.5被开发者用于搭建“Claude Code+GLM 4.5”组合方案，成为国外模型的国内平替方案，在掘金等开发者社区广泛传播，进一步扩大了其在开发者群体中的影响力，推动了开源生态的完善。

4. 2025年7月至8月，Rokid Glasses、智联招聘、脉脉、沉浸式翻译等多家企业宣布接入GLM 4.5，推动模型从技术研发走向实际应用，覆盖智能硬件、招聘、翻译等多个场景，验证了其商业价值。

5. 2025年8月，GLM 4.5与OpenAI开源的gpt-oss系列模型展开正面比拼，其综合表现依旧领先，进一步巩固了其在开源模型中的领先地位，也引发了业内对“开源与闭源模型发展路径”的讨论。

Question 2

GLM 4.5的API价格是多少？

Accepted Answer

GLM 4.5的API输入价格为4.3500元/百万Token，输出价格为15.9500元/百万Token。

Question 3

GLM 4.5支持哪些功能？

Accepted Answer

GLM 4.5的功能特性信息暂未收录。

Question 4

GLM 4.5是国产模型吗？

Accepted Answer

是的，GLM 4.5是由Zhipu开发的国产AI大模型，可直接访问使用。

GLM 4.5

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

📊
能力雷达星图

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API

平台：OpenRouter 模型：GLM 4.5

平台：SiliconFlow 🚫[已下架] 模型：GLM-4.5

⚡ 体验反馈与渠道测速

🏛️ 官方渠道体验

🤝 第三方测速反馈

⚔️
性能对标产品

Hy3 preview(high)

Qwen3.6-27B(Thinking)

MiMo V2.5 Pro Base

MiMo V2.5 Base

社区真实评价