GLM 4.5 Air

GLM 4.5 Air

glm-4-5-air

机构/公司
Zhipu(国内 🇨🇳)
发布日期
未披露
版本状态
⭐ 当前主力
开源状态
🌍 开源可见
能力模态
💬 大语言模型
上下文长度
未知
参数规模:暂未收录
主要语言:暂未收录
底层架构:暂未收录
开源协议:暂未收录
官方计费模式:参见下方【使用模块】

📖
词条百科 Wiki

# 一、简介与定位

中国北京智谱华章科技股份有限公司(简称“智谱AI”)于2025年7月28日,同步发布了GLM 4.5系列大模型,其中GLM 4.5 Air定位为开源轻量化主力大模型,主打高参数效率与低成本部署。

GLM 4.5 Air的名称中,“GLM”是智谱大模型系列的通用前缀,源自“General Language Model”(通用语言模型);“4.5”代表其隶属于GLM 4.5代系,与同系列旗舰模型共享核心技术架构;“Air”后缀则凸显其轻量化特性,主打高效部署与低使用成本。其核心功能围绕智能体应用展开,支持推理、编码与智能体能力的原生融合,可完成全栈开发、PPT制作、代码编写等各类任务;官方使用门槛极低,无需订阅,API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,高速版最高可达100tokens/秒,新用户注册并完成实名后可获得一定免费额度,无明显使用限制;同期发布的“兄弟模型”为GLM 4.5,作为系列旗舰模型,参数量更高、性能更强,与GLM 4.5 Air形成高低配互补。

目前GLM 4.5 Air仍处于生命周期中的活跃阶段,是智谱AI面向中小开发者和轻量化部署场景的主力模型,其最突出的核心特点是高参数效率,以1060亿总参数、120亿激活参数,实现了媲美更高参数量模型的综合性能,同时兼顾低成本与易部署特性。

# 二、发展历程

# 2.1 研发背景

GLM 4.5 Air发布前,国内大模型市场已形成激烈竞争格局,主流模型包括DeepSeek-R1、Kimi-K2、Qwen3等。其中DeepSeek-R1以高参数量主打推理性能,Kimi-K2侧重长文本处理,Qwen3则在开源生态布局上表现突出,但这些模型普遍存在参数效率偏低、部署成本较高的痛点——要么参数量过大,普通开发者难以负担部署算力;要么性能与成本难以兼顾,无法满足中小开发者的轻量化需求。与此同时,2025年AI智能体热潮兴起,市场对兼具推理、编码与智能体能力的轻量化模型需求激增,智谱AI此前发布的GLM 4模型已停滞更新近一年,性能逐步被竞品反超,在此背景下,GLM 4.5系列(含GLM 4.5 Air)应运而生,聚焦参数效率与成本优化,填补轻量化智能体模型的市场空白。

# 2.2 关键节点

2025年初,智谱AI明确“开源年”战略,启动GLM 4.5代系模型的研发立项,核心目标是突破上一代模型参数效率低的短板,打造兼顾性能与成本的全系列模型,GLM 4.5 Air作为轻量化版本同步进入研发阶段。同年4月,智谱AI发布GLM-4-32B-0414等开源模型,积累了更多参数优化与开源部署经验,为GLM 4.5 Air的研发奠定基础。7月中旬,GLM 4.5 Air完成内部测试,重点验证了其推理速度、编码能力与部署兼容性,优化了低算力环境下的运行稳定性。7月28日晚,智谱AI正式对外发布GLM 4.5系列模型,GLM 4.5 Air与旗舰版GLM 4.5同步在Hugging Face与ModelScope平台开源,模型权重遵循MIT License,开放API调用服务。发布后不到半个月,GLM 4.5 Air随系列模型一同接入“模力社区-智谱大模型MaaS平台”,进一步拓展了部署场景。

# 2.3 家族构成

GLM 4.5 Air隶属于智谱GLM大模型家族,该家族以通用语言模型为核心,覆盖从旗舰到轻量化、从单模态到多模态的全场景需求,核心成员包括:

GLM 4.5:家族旗舰模型,采用混合专家(MoE)架构,总参数量3550亿,激活参数320亿,首次在单个模型中实现推理、编码和智能体能力的原生融合,综合性能位列全球第三、国产及开源模型第一,主打复杂场景与企业级部署。

GLM 4.5 Air:轻量化主力模型,总参数量1060亿,激活参数120亿,继承旗舰模型的核心技术,主打高参数效率与低成本,面向中小开发者和轻量化部署场景,开源可商用,是家族中最具性价比的模型之一。

GLM 4.5V:多模态推理模型,基于GLM 4.5 Air的文本基座研发,总参数1060亿,在41个公开视觉多模态榜单中达到同级别开源模型SOTA性能,可处理图像、视频、文档理解及GUI Agent等任务。

GLM-Z1系列:侧重推理优化的系列模型,包括GLM-Z1-32B-0414、GLM-Z1-9B-0414等,主打高速推理与轻量化部署,其中GLM-Z1-AirX极速版推理速度可达200tokens/秒,价格极具优势。

# 三、核心技术剖析

# 3.1 固有技术

GLM 4.5 Air继承了GLM家族的核心底层技术,首先采用混合专家(MoE)架构,这是上一代GLM模型及GLM 4.5旗舰版的核心架构,其核心逻辑是将模型分为多个“专家”模块,每个模块负责处理特定类型的任务,推理时仅激活部分专家,在保证性能的同时降低算力消耗,这也是其实现高参数效率的基础。其次,继承了GLM系列的预训练与对齐体系,先在15万亿token的通用数据上进行预训练,再在代码、推理、智能体等领域的8万亿token数据上进行针对性训练,最后通过强化学习进一步增强核心能力,确保模型的通用性与实用性。此外,还延续了上一代模型的工具调用框架,可无缝对接各类开发插件,支持多工具协作完成复杂任务。

# 3.2 创新技术

GLM 4.5 Air的创新点主要围绕参数效率优化与能力融合展开,核心亮点如下:

1.  优化型MoE架构设计:在MoE层中采用无损负载均衡路由和Sigmoid门控机制,解决了传统MoE架构中专家负载不均、资源浪费的问题,同时减少模型宽度、增加模型深度,进一步提升推理能力,让1060亿总参数的模型实现了媲美更高参数量模型的性能,参数效率大幅提升。

2.  注意力机制升级:引入Grouped-Query Attention(分组查询注意力),并结合部分位置旋转编码(Partial RoPE),同时将注意力头数量提升至常规模型的2.5倍,在不降低训练效率的前提下,显著提升了模型在推理类基准测试中的表现,解决了长文本处理中的注意力分散问题。

3.  双模式推理优化:支持两种推理模式——用于复杂推理和工具使用的思考模式,以及用于即时响应的非思考模式,可根据任务复杂度自动切换,既保证了复杂任务的完成质量,又提升了简单任务的响应速度,兼顾实用性与交互体验。

4.  MTP层嵌入与推测式解码:加入多Token预测(MTP)层,支持推测式解码,在推理阶段可同时预测多个Token,结合高速推理优化,让模型的生成速度最高可达100tokens/秒,大幅提升了交互效率,解决了同类轻量化模型推理速度慢的痛点。

5.  优化器升级:采用Muon优化器,相比传统优化器,收敛速度更快,且具备更强的超大批次容忍能力,缩短了模型训练周期,同时提升了模型的稳定性,减少了推理过程中的错误率。

# 四、表现评估

# 4.1 历史与现状

GLM 4.5 Air刚发布时,凭借高参数效率、低成本与开源特性,迅速获得市场关注,发布当日便随系列模型登上Hugging Face和OpenRouter趋势榜第一,成为当时最受关注的开源轻量化模型,填补了国内轻量化智能体模型的空白,打破了DeepSeek-R1、Kimi-K2在同类场景的垄断。截至2026年4月,GLM 4.5 Air仍保持活跃,虽智谱AI已发布GLM-5等新一代模型,但由于其低成本、易部署的优势,仍是中小开发者首选的轻量化模型之一,广泛应用于个人开发、小型企业智能应用等场景,同时依托模力社区等平台,生态布局持续完善,但在高端企业级场景的市场份额被GLM 4.5旗舰版及新一代模型逐步替代。

# 4.2 优势亮点

结合业内公认的评测基准与媒体实测,GLM 4.5 Air的优势主要集中在以下三个维度,表现突出:

1.  参数效率领先:在衡量模型综合能力的12项核心评测基准(包括MMLU Pro、AIME 24、LiveCodeBench等)中,GLM 4.5 Air以1060亿总参数,实现了接近更高参数量模型的性能,在SWE-bench Verified榜单上,其位于性能/参数比帕累托前沿,相同规模下性能最优,参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,但综合表现不落下风。

2.  智能体与编码能力出色:在智能体任务基准测试中,其表现媲美Claude 4 Sonnet,工具调用成功率较高;在Agentic Coding的52项任务测试中,对比Kimi K2的胜率为53.9%,对比Qwen3-Coder的胜率达80.8%,可胜任全栈开发任务,能独立编写复杂应用、游戏、交互网页,甚至可根据需求生成设计感较强的PPT,实测中能快速完成“B站网页端Demo”“谷歌搜索网站”等开发任务。

3.  成本与部署优势显著:API调用价格远低于同类模型,输入0.8元/百万tokens、输出2元/百万tokens,约为GPT-4的1/12,DeepSeek-R1的80%,且支持高速推理(最高100tokens/秒),适合低延迟、高并发的部署需求;同时开源可商用,支持在消费级显卡上流畅运行,大幅降低了中小开发者的使用与部署成本。

# 4.3 缺点与不足

客观来看,GLM 4.5 Air仍存在明显短板,主要集中在以下方面:

1.  复杂推理能力有限:受限于轻量化定位,其在超高难度数理推理(如MATH 500高阶题目)、复杂逻辑分析场景中,表现不如GLM 4.5旗舰版及国外头部模型,偶尔会出现推理步骤不完整、逻辑漏洞的问题。

2.  代码开发存在局限:虽编码能力出色,但在超复杂项目开发中,偶尔会出现代码出错、语法不规范的问题,对小众编程语言的支持不够完善,相比Claude Code等专业编码模型,仍有提升空间。

3.  多模态能力缺失:作为纯文本模型,GLM 4.5 Air不具备图像、视频等多模态处理能力,无法完成图文生成、视频解析等任务,需搭配GLM 4.5V等多模态模型才能实现多场景覆盖,灵活性不足。

4.  长文本处理短板:在处理超长篇文本(如10万字以上文档)时,会出现信息遗忘、上下文衔接不畅的问题,虽通过注意力机制优化有所改善,但仍不如专门优化长文本的Kimi-K2等模型。

# 五、重大事件

1.  2025年7月28日,GLM 4.5 Air随系列模型正式发布,同步在Hugging Face与ModelScope平台开源,发布当日便登上两大平台趋势榜第一,引发开源社区广泛关注,单日模型下载量突破10万次,成为当时最热门的开源轻量化模型。

2.  2025年8月中旬,GLM 4.5 Air接入“模力社区-智谱大模型MaaS平台”,依托该平台的生态资源,快速覆盖浦东千行百业的轻量化部署场景,推动了人工智能在中小企业的落地应用,进一步提升了市场渗透率。

3.  2025年下半年,GLM 4.5 Air因低成本优势,引发国内大模型行业的价格关注,其API定价成为同类模型的参考标准,间接推动了国内开源大模型的价格下调,加速了大模型的普惠化进程。

4.  2026年初,GLM 4.5 Air在开源社区形成规模化二创,开发者基于其基座模型,微调开发出多款适配特定场景的轻量化模型,覆盖教育、办公、小型开发等领域,进一步丰富了其生态布局,也凸显了其开源价值。

由本站联合社区极客共同编撰,最后更新:2026-05-02 16:01:24
开放 Wiki 模式开启中

📊
能力雷达星图

权威基准

模型家族构成

🔗 相关链接

词条待补全

没有找到体验地址?去反馈!

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API
API价格
实时更新
平台:OpenRouter 模型:GLM 4.5 Air
输入(/1M)0.94
输出(/1M)6.16
价格由固定汇率换算而来,可能存在细微差距。

体验反馈与渠道测速

🤝 第三方测速反馈
🔌
平台:OpenRouter
模型:GLM 4.5 Air
状态:暂无反馈0 票
前往直达

⚔️
性能对标产品

AI

Hy3 preview(high)

Unknown
Qwen3.6-27B(Thinking)

Qwen3.6-27B(Thinking)

Qwen
MiMo V2.5 Pro Base

MiMo V2.5 Pro Base

Xiaomi
MiMo V2.5 Base

MiMo V2.5 Base

Xiaomi
💬

社区真实评价

🤐

登录后才能发表评价,与极客们一起交流哦~

正在拉取评论数据...