Name: GLM 4.5 Air
Rating: 143 (1 reviews)
Author: Zhipu

Question 1

GLM 4.5 Air是什么？

Accepted Answer

一、简介与定位

中国北京智谱华章科技股份有限公司（简称“智谱AI”）于2025年7月28日，同步发布了GLM 4.5系列大模型，其中GLM 4.5 Air定位为开源轻量化主力大模型，主打高参数效率与低成本部署。

GLM 4.5 Air的名称中，“GLM”是智谱大模型系列的通用前缀，源自“General Language Model”（通用语言模型）；“4.5”代表其隶属于GLM 4.5代系，与同系列旗舰模型共享核心技术架构；“Air”后缀则凸显其轻量化特性，主打高效部署与低使用成本。其核心功能围绕智能体应用展开，支持推理、编码与智能体能力的原生融合，可完成全栈开发、PPT制作、代码编写等各类任务；官方使用门槛极低，无需订阅，API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens，高速版最高可达100tokens/秒，新用户注册并完成实名后可获得一定免费额度，无明显使用限制；同期发布的“兄弟模型”为GLM 4.5，作为系列旗舰模型，参数量更高、性能更强，与GLM 4.5 Air形成高低配互补。

目前GLM 4.5 Air仍处于生命周期中的活跃阶段，是智谱AI面向中小开发者和轻量化部署场景的主力模型，其最突出的核心特点是高参数效率，以1060亿总参数、120亿激活参数，实现了媲美更高参数量模型的综合性能，同时兼顾低成本与易部署特性。

二、发展历程

2.1 研发背景

GLM 4.5 Air发布前，国内大模型市场已形成激烈竞争格局，主流模型包括DeepSeek-R1、Kimi-K2、Qwen3等。其中DeepSeek-R1以高参数量主打推理性能，Kimi-K2侧重长文本处理，Qwen3则在开源生态布局上表现突出，但这些模型普遍存在参数效率偏低、部署成本较高的痛点——要么参数量过大，普通开发者难以负担部署算力；要么性能与成本难以兼顾，无法满足中小开发者的轻量化需求。与此同时，2025年AI智能体热潮兴起，市场对兼具推理、编码与智能体能力的轻量化模型需求激增，智谱AI此前发布的GLM 4模型已停滞更新近一年，性能逐步被竞品反超，在此背景下，GLM 4.5系列（含GLM 4.5 Air）应运而生，聚焦参数效率与成本优化，填补轻量化智能体模型的市场空白。

2.2 关键节点

2025年初，智谱AI明确“开源年”战略，启动GLM 4.5代系模型的研发立项，核心目标是突破上一代模型参数效率低的短板，打造兼顾性能与成本的全系列模型，GLM 4.5 Air作为轻量化版本同步进入研发阶段。同年4月，智谱AI发布GLM-4-32B-0414等开源模型，积累了更多参数优化与开源部署经验，为GLM 4.5 Air的研发奠定基础。7月中旬，GLM 4.5 Air完成内部测试，重点验证了其推理速度、编码能力与部署兼容性，优化了低算力环境下的运行稳定性。7月28日晚，智谱AI正式对外发布GLM 4.5系列模型，GLM 4.5 Air与旗舰版GLM 4.5同步在Hugging Face与ModelScope平台开源，模型权重遵循MIT License，开放API调用服务。发布后不到半个月，GLM 4.5 Air随系列模型一同接入“模力社区-智谱大模型MaaS平台”，进一步拓展了部署场景。

2.3 家族构成

GLM 4.5 Air隶属于智谱GLM大模型家族，该家族以通用语言模型为核心，覆盖从旗舰到轻量化、从单模态到多模态的全场景需求，核心成员包括：

GLM 4.5：家族旗舰模型，采用混合专家（MoE）架构，总参数量3550亿，激活参数320亿，首次在单个模型中实现推理、编码和智能体能力的原生融合，综合性能位列全球第三、国产及开源模型第一，主打复杂场景与企业级部署。

GLM 4.5 Air：轻量化主力模型，总参数量1060亿，激活参数120亿，继承旗舰模型的核心技术，主打高参数效率与低成本，面向中小开发者和轻量化部署场景，开源可商用，是家族中最具性价比的模型之一。

GLM 4.5V：多模态推理模型，基于GLM 4.5 Air的文本基座研发，总参数1060亿，在41个公开视觉多模态榜单中达到同级别开源模型SOTA性能，可处理图像、视频、文档理解及GUI Agent等任务。

GLM-Z1系列：侧重推理优化的系列模型，包括GLM-Z1-32B-0414、GLM-Z1-9B-0414等，主打高速推理与轻量化部署，其中GLM-Z1-AirX极速版推理速度可达200tokens/秒，价格极具优势。

三、核心技术剖析

3.1 固有技术

GLM 4.5 Air继承了GLM家族的核心底层技术，首先采用混合专家（MoE）架构，这是上一代GLM模型及GLM 4.5旗舰版的核心架构，其核心逻辑是将模型分为多个“专家”模块，每个模块负责处理特定类型的任务，推理时仅激活部分专家，在保证性能的同时降低算力消耗，这也是其实现高参数效率的基础。其次，继承了GLM系列的预训练与对齐体系，先在15万亿token的通用数据上进行预训练，再在代码、推理、智能体等领域的8万亿token数据上进行针对性训练，最后通过强化学习进一步增强核心能力，确保模型的通用性与实用性。此外，还延续了上一代模型的工具调用框架，可无缝对接各类开发插件，支持多工具协作完成复杂任务。

3.2 创新技术

GLM 4.5 Air的创新点主要围绕参数效率优化与能力融合展开，核心亮点如下：

1. 优化型MoE架构设计：在MoE层中采用无损负载均衡路由和Sigmoid门控机制，解决了传统MoE架构中专家负载不均、资源浪费的问题，同时减少模型宽度、增加模型深度，进一步提升推理能力，让1060亿总参数的模型实现了媲美更高参数量模型的性能，参数效率大幅提升。

2. 注意力机制升级：引入Grouped-Query Attention（分组查询注意力），并结合部分位置旋转编码（Partial RoPE），同时将注意力头数量提升至常规模型的2.5倍，在不降低训练效率的前提下，显著提升了模型在推理类基准测试中的表现，解决了长文本处理中的注意力分散问题。

3. 双模式推理优化：支持两种推理模式——用于复杂推理和工具使用的思考模式，以及用于即时响应的非思考模式，可根据任务复杂度自动切换，既保证了复杂任务的完成质量，又提升了简单任务的响应速度，兼顾实用性与交互体验。

4. MTP层嵌入与推测式解码：加入多Token预测（MTP）层，支持推测式解码，在推理阶段可同时预测多个Token，结合高速推理优化，让模型的生成速度最高可达100tokens/秒，大幅提升了交互效率，解决了同类轻量化模型推理速度慢的痛点。

5. 优化器升级：采用Muon优化器，相比传统优化器，收敛速度更快，且具备更强的超大批次容忍能力，缩短了模型训练周期，同时提升了模型的稳定性，减少了推理过程中的错误率。

四、表现评估

4.1 历史与现状

GLM 4.5 Air刚发布时，凭借高参数效率、低成本与开源特性，迅速获得市场关注，发布当日便随系列模型登上Hugging Face和OpenRouter趋势榜第一，成为当时最受关注的开源轻量化模型，填补了国内轻量化智能体模型的空白，打破了DeepSeek-R1、Kimi-K2在同类场景的垄断。截至2026年4月，GLM 4.5 Air仍保持活跃，虽智谱AI已发布GLM-5等新一代模型，但由于其低成本、易部署的优势，仍是中小开发者首选的轻量化模型之一，广泛应用于个人开发、小型企业智能应用等场景，同时依托模力社区等平台，生态布局持续完善，但在高端企业级场景的市场份额被GLM 4.5旗舰版及新一代模型逐步替代。

4.2 优势亮点

结合业内公认的评测基准与媒体实测，GLM 4.5 Air的优势主要集中在以下三个维度，表现突出：

1. 参数效率领先：在衡量模型综合能力的12项核心评测基准（包括MMLU Pro、AIME 24、LiveCodeBench等）中，GLM 4.5 Air以1060亿总参数，实现了接近更高参数量模型的性能，在SWE-bench Verified榜单上，其位于性能/参数比帕累托前沿，相同规模下性能最优，参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3，但综合表现不落下风。

2. 智能体与编码能力出色：在智能体任务基准测试中，其表现媲美Claude 4 Sonnet，工具调用成功率较高；在Agentic Coding的52项任务测试中，对比Kimi K2的胜率为53.9%，对比Qwen3-Coder的胜率达80.8%，可胜任全栈开发任务，能独立编写复杂应用、游戏、交互网页，甚至可根据需求生成设计感较强的PPT，实测中能快速完成“B站网页端Demo”“谷歌搜索网站”等开发任务。

3. 成本与部署优势显著：API调用价格远低于同类模型，输入0.8元/百万tokens、输出2元/百万tokens，约为GPT-4的1/12，DeepSeek-R1的80%，且支持高速推理（最高100tokens/秒），适合低延迟、高并发的部署需求；同时开源可商用，支持在消费级显卡上流畅运行，大幅降低了中小开发者的使用与部署成本。

4.3 缺点与不足

客观来看，GLM 4.5 Air仍存在明显短板，主要集中在以下方面：

1. 复杂推理能力有限：受限于轻量化定位，其在超高难度数理推理（如MATH 500高阶题目）、复杂逻辑分析场景中，表现不如GLM 4.5旗舰版及国外头部模型，偶尔会出现推理步骤不完整、逻辑漏洞的问题。

2. 代码开发存在局限：虽编码能力出色，但在超复杂项目开发中，偶尔会出现代码出错、语法不规范的问题，对小众编程语言的支持不够完善，相比Claude Code等专业编码模型，仍有提升空间。

3. 多模态能力缺失：作为纯文本模型，GLM 4.5 Air不具备图像、视频等多模态处理能力，无法完成图文生成、视频解析等任务，需搭配GLM 4.5V等多模态模型才能实现多场景覆盖，灵活性不足。

4. 长文本处理短板：在处理超长篇文本（如10万字以上文档）时，会出现信息遗忘、上下文衔接不畅的问题，虽通过注意力机制优化有所改善，但仍不如专门优化长文本的Kimi-K2等模型。

五、重大事件

1. 2025年7月28日，GLM 4.5 Air随系列模型正式发布，同步在Hugging Face与ModelScope平台开源，发布当日便登上两大平台趋势榜第一，引发开源社区广泛关注，单日模型下载量突破10万次，成为当时最热门的开源轻量化模型。

2. 2025年8月中旬，GLM 4.5 Air接入“模力社区-智谱大模型MaaS平台”，依托该平台的生态资源，快速覆盖浦东千行百业的轻量化部署场景，推动了人工智能在中小企业的落地应用，进一步提升了市场渗透率。

3. 2025年下半年，GLM 4.5 Air因低成本优势，引发国内大模型行业的价格关注，其API定价成为同类模型的参考标准，间接推动了国内开源大模型的价格下调，加速了大模型的普惠化进程。

4. 2026年初，GLM 4.5 Air在开源社区形成规模化二创，开发者基于其基座模型，微调开发出多款适配特定场景的轻量化模型，覆盖教育、办公、小型开发等领域，进一步丰富了其生态布局，也凸显了其开源价值。

Question 2

GLM 4.5 Air的API价格是多少？

Accepted Answer

GLM 4.5 Air的API输入价格为0.9425元/百万Token，输出价格为6.1625元/百万Token。

Question 3

GLM 4.5 Air支持哪些功能？

Accepted Answer

GLM 4.5 Air的功能特性信息暂未收录。

Question 4

GLM 4.5 Air是国产模型吗？

Accepted Answer

是的，GLM 4.5 Air是由Zhipu开发的国产AI大模型，可直接访问使用。

GLM 4.5 Air

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

📊
能力雷达星图

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API

平台：OpenRouter 模型：GLM 4.5 Air

⚡ 体验反馈与渠道测速

🤝 第三方测速反馈

⚔️
性能对标产品

Hy3 preview(high)

Qwen3.6-27B(Thinking)

MiMo V2.5 Pro Base

MiMo V2.5 Base

社区真实评价