GLM 4.7

GLM 4.7

glm-4-7

机构/公司
Zhipu(国内 🇨🇳)
发布日期
2026-01-28
版本状态
⭐ 当前主力
开源状态
🌍 开源可见
能力模态
💬 大语言模型
上下文长度
未知
参数规模:暂未收录
主要语言:暂未收录
底层架构:暂未收录
开源协议:暂未收录
官方计费模式:参见下方【使用模块】

📖
词条百科 Wiki

# 一、简介与定位

中国智谱AI(Zhipu AI,后更名为Z.ai)于2025年12月23日正式发布GLM 4.7大模型,定位为聚焦编程与智能体场景的开源旗舰大模型,主打实战化能力提升。

GLM 4.7中,“GLM”是“General Language Model”(通用语言模型)的缩写,延续智谱GLM系列的命名逻辑,后缀“4.7”代表其为GLM 4系列的迭代升级版本,区别于前代的4.6版本;核心功能聚焦编程能力强化、复杂推理优化与智能体协同,可实现代码生成与修复、长程任务规划、工具调用等实战场景需求。使用门槛方面,该模型全面开源,无需订阅即可通过Github获取源码,官方API可通过BigModel.cn接入,暂未明确公开免费额度,无明显使用地域限制;同期无明确“兄弟模型”发布,但其发布前后智谱AI密集推出GLM-4.6、GLM-5等系列模型,形成迭代矩阵。

当前GLM 4.7处于生命周期的活跃阶段,未被淘汰,仍是智谱AI开源模型体系中的核心主力之一;其最突出的核心特点是引入显式“思考层”机制,实现“先思考、再行动”,在编程与复杂推理场景中具备更强的逻辑一致性和任务完成度。

# 二、发展历程

# 2.1 研发背景

GLM 4.7发布前,行业内主流大模型呈现“闭源领跑、开源追赶”的格局:闭源领域,GPT-5系列、Claude 4.5系列凭借强大的综合能力占据高端市场,在编程、复杂推理等场景表现突出,但存在使用成本高、不开源、国内用户访问受限等问题;开源领域,Qwen、DeepSeek等国产模型及Llama系列海外模型快速迭代,虽具备开源优势,但普遍存在逻辑一致性不足、多轮任务易遗忘、编程实战能力与闭源模型差距明显等痛点。彼时,智谱AI正冲刺港股“大模型第一股”,亟需一款能在开源领域突破、补齐编程能力短板、提升国际影响力的旗舰模型,GLM 4.7正是在这样的行业局势下应运而生,聚焦“实战化”突破,填补国产开源模型在高端编程场景的短板。

# 2.2 关键节点

GLM 4.7的研发紧密衔接GLM 4.6的迭代节奏,早在2025年下半年便启动立项,核心目标是解决前代模型在代码生成逻辑不一致、多轮任务遗忘、工具使用碎片化等瓶颈;经过数月的技术打磨与数据训练,2025年12月中旬进入内部内测阶段,邀请部分开发者与企业用户参与测试,收集编程、推理等场景的优化建议,快速调整模型参数与思考机制;2025年12月22日,智谱AI开启模型发布预热,引发行业广泛关注;12月23日,正式上线并宣布全面开源,同步开放API接入与开源代码下载,12月24日完成全平台布局,接入智谱清言APP、z.ai开发平台等场景。

# 2.3 家族构成

GLM 4.7隶属于智谱AI GLM系列大模型,该家族自2022年推出GLM-130B双语稠密模型后,逐步构建起覆盖多场景、多规格的模型矩阵,核心相关模型如下:

GLM-130B:2022年发布的双语稠密模型,是GLM系列的破局之作,具备较强的双语处理能力,为后续模型的架构研发奠定了基础,定位为早期旗舰级开源模型,主要用于学术研究与基础场景落地。

GLM-4.6:GLM 4.7的前代模型,发布于2025年,定位为通用开源模型,在对话、创意写作等场景有较好表现,但在编程、复杂推理的逻辑一致性上存在明显短板,为GLM 4.7的迭代提供了优化方向。

GLM-5:2026年2月发布的新一代旗舰模型,定位为从“对话编码”向“Agentic Engineering”范式转型的闭源模型,采用MoE架构,参数量达7440亿,聚焦智能体工程场景,整体性能优于GLM 4.7,是智谱AI高端闭源模型的核心代表。

GLM-5-Turbo:2026年3月发布,专为OpenClaw生态系统构建的端到端智能体工作流优化模型,支持超长上下文窗口,幻觉率低,侧重智能体任务的稳定执行,与GLM 4.7形成开源与闭源、通用与专项的互补。

GLM-OCR:2026年3月发布的专项多模态模型,聚焦复杂布局下的文字识别与语义提取,基于GLM-V编码器—解码器架构构建,开源且推理高效,属于GLM家族的专项能力补充模型。

GLM-Image:2026年1月发布的开源图像生成模型,采用AR+Diffusion混合架构,专注于高知识密度与高保真图像生成,强化中英文字符渲染能力,是GLM家族多模态布局的重要组成部分。

# 三、核心技术剖析

# 3.1 固有技术

GLM 4.7继承了GLM系列基座模型的核心底层架构,采用标准的Transformer稠密架构,延续了GLM系列成熟的预训练与对齐手段,确保模型具备扎实的语言理解与生成基础。同时,继承了前代模型的多模态处理能力,可兼容文本、图像等多类型输入,无需额外适配即可完成基础的多模态交互任务;在训练流程上,沿用了智谱AI成熟的语料训练体系,基于大规模通用语料与编程专项语料进行预训练,保障了模型在通用场景与核心专项场景的基础性能。

# 3.2 创新技术

GLM 4.7的核心创新的是引入显式“思考层(Thinking Layer)”机制,打破传统大模型“输入→直接输出”的模式,实现“先思考、再行动”,同时在架构与训练策略上有针对性优化,具体创新点如下:

1.  三重思考模式,解决逻辑一致性与遗忘问题:这是GLM 4.7最核心的创新,首次系统实现三种思考层,让模型具备类似人类的分步思考能力。一是Interleaved Thinking(分步思考),模型在输出或调用工具前,会自动生成隐性推理过程,分解任务目标、制定路径、预测障碍,避免“一步错步步错”,在真实编程任务(SWE-bench)中准确率提升5%-10%;二是Preserved Thinking(记忆思考),引入“推理状态缓存”,将思考链显式保留在内部上下文,避免多轮任务中遗忘推理逻辑,减少20%的逻辑漂移,在长链任务中性能提升16.5%;三是Turn-level Thinking(可控思考),支持用户自主控制每一轮思考深度,轻量任务关闭思考层提升响应速度,复杂任务开启思考层保障准确率,实现效率与质量的平衡。

2.  架构优化,兼顾性能与效率:GLM 4.7对注意力机制进行升级,从GLM 4.6的GQA切换为MLA + DeepSeek Sparse Attention混合架构,在保持超长上下文保真度的同时,显著降低训练与推理的计算开销,让模型在长文本处理与复杂任务推理中更高效,无需过高算力即可稳定运行。

3.  编程专项优化,提升实战能力:引入Multi-Token Prediction(MTP)训练策略,跟进行业前沿技术,强化代码生成的连贯性与准确性;同时构建大量真实编程执行环境,让模型在多轮长周期编程任务中学习错误修正行为,不仅能生成逻辑严谨的代码,还能优化前端视觉设计,生成具备现代感的网页、幻灯片等作品,摆脱“开发者审美”的局限。

# 四、表现评估

# 4.1 历史与现状

GLM 4.7刚发布时,凭借开源优势与编程能力的突破性提升,迅速跻身开源大模型第一梯队:发布当日便登顶Artificial Analysis“AA智能指数”开源模型榜首,在多个编程类榜单中超越同类开源模型,甚至优于部分闭源模型,引发全球开发者关注,成为国产开源模型“突围”的代表。截至2026年4月,GLM 4.7仍是开源领域表现优秀的编程类模型,但其行业地位受到GLM-5系列、DeepSeek V3等新模型的冲击,核心优势仍集中在“开源免费+编程实战”,受众主要为开发者、中小企业及科研机构,在高端闭源模型的挤压下,难以进入头部商业场景,但在开源生态与中小规模应用中仍保持较高活跃度。

# 4.2 优势亮点

结合业内权威榜单与实际测试表现,GLM 4.7的优势主要集中在编程、复杂推理与开源易用性三个维度,具体如下:

1.  编程能力突出,开源领域领先:在LMArena代码竞技场盲测中,GLM 4.7位列开源模型第一,超越GPT-5.2;在LiveCodeBench V6中得分84.8,超过Claude 4.5 Sonnet;在代码竞技场WebDev中斩获开源第一,跻身全球第六;能轻松完成多语言代码生成、代码修复、多文件代码库修改等任务,甚至能优化前端视觉设计,生成符合设计师审美 的作品,满足日常开发与中小企业编程需求绰绰有余。

2.  复杂推理能力优异:在AIME 2025(数学)测试中,表现优于Claude 4.5 Sonnet和GPT-5.1;在人类终极考试(HLE)中得分42%,较GLM-4.6提升38%,接近GPT-5.1水平;在τ²-Bench真实世界交互测试中,与Claude 4.5 Sonnet持平,三重思考模式有效解决了复杂任务中的逻辑漂移与遗忘问题。

3.  开源易用,生态完善:全面开源,开发者可通过Github免费获取源码,支持vLLM、SGLang等工具部署,降低推理时延与算力成本;官方提供API接入、全栈开发平台支持,同时兼容Claude Code、TRAE等主流编程框架,上手门槛低,适合各类开发者使用;开源社区活跃,形成了一定的二创与优化生态。

4.  中文处理能力扎实:作为国产模型,GLM 4.7基于中文语料优化训练,在中文编程注释、中文需求理解、中文复杂推理等场景中,表现优于同类海外开源模型,适配国内开发者的使用习惯。

# 4.3 缺点与不足

GLM 4.7虽表现亮眼,但仍存在明显短板,客观来看主要有以下几点:

1.  综合性能不及高端闭源模型:尽管在开源领域表现突出,但与GPT-5系列、Claude 4.5 Opus等高端闭源模型相比,仍有一定差距,在超复杂任务规划、多模态深度交互等场景中,稳定性与准确性不足,部分早期用户反馈其实际表现未明显优于Claude 4.5 Sonnet,甚至不及Minimax M2.1。

2.  部分场景存在幻觉问题:在处理小众领域知识、冷门编程框架相关任务时,容易出现逻辑错误或信息偏差,幻觉率虽低于前代模型,但仍未完全解决,尤其在缺乏足够训练语料的场景中,表现不够稳定。

3.  模型迭代过快,生态适配滞后:智谱AI模型发布节奏密集,用户反馈“GLM-4.6还未熟悉,GLM 4.7就已发布”,导致第三方工具、插件对GLM 4.7的适配不够及时,部分场景下无法充分发挥模型的核心能力。

4.  专项能力不均衡:过度侧重编程与推理能力,在创意写作、角色扮演等场景中的提升有限,相较于同类开源模型,无明显优势,综合场景适配性不足。

# 五、重大事件

1.  2025年12月23日,GLM 4.7正式发布并全面开源:智谱AI在递交港股招股书后迅速推出该模型,发布当日便登顶Artificial Analysis“AA智能指数”开源模型榜首,引发行业广泛关注,成为国产开源模型在编程领域突破的标志性事件,被媒体称为“国产大模型的编程突围”。

2.  2025年12月底,引发全球开源社区热议:GLM 4.7开源后,被硅谷开发者称为“来自中国的编程礼物”,出现大量海外开发者“套壳”使用的现象,打破了海外开源模型对全球开发者社区的垄断,提升了中国大模型的国际影响力。

3.  2026年初,多项榜单登顶,验证核心实力:GLM 4.7相继在Vals Index、Design Arena等权威榜单中取得优异成绩,其中Vals Index榜单中空降开源模型第一,Design Arena中胜率与Elo评分高居第二,超过Claude Opus 4.5和GPT-5.2,进一步巩固了其在开源编程模型中的领先地位。

4.  2026年3月,适配主流编程框架,扩大应用范围:GLM 4.7成功接入Claude Code、TRAE等主流编程框架,实现“先思考、再行动”机制在多场景的落地,其任务完成率较前代提升10%-15%,成为中小企业与开发者的首选开源编程模型之一。

由本站联合社区极客共同编撰,最后更新:2026-05-02 16:01:23
开放 Wiki 模式开启中

📊
能力雷达星图

权威基准

模型家族构成

🔗 相关链接

词条待补全

没有找到体验地址?去反馈!

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API
API价格
实时更新
平台:OpenRouter 模型:GLM 4.7
输入(/1M)2.75
输出(/1M)12.62
价格由固定汇率换算而来,可能存在细微差距。

体验反馈与渠道测速

🤝 第三方测速反馈
🔌
平台:OpenRouter
模型:GLM 4.7
状态:暂无反馈0 票
前往直达

⚔️
性能对标产品

AI

Hy3 preview(high)

Unknown
Qwen3.6-27B(Thinking)

Qwen3.6-27B(Thinking)

Qwen
MiMo V2.5 Pro Base

MiMo V2.5 Pro Base

Xiaomi
MiMo V2.5 Base

MiMo V2.5 Base

Xiaomi
💬

社区真实评价

🤐

登录后才能发表评价,与极客们一起交流哦~

正在拉取评论数据...