Name: GLM 4.6
Rating: 72 (1 reviews)
Author: Zhipu

Question 1

GLM 4.6是什么？

Accepted Answer

一、简介与定位

GLM 4.6是中国智谱AI于2025年9月30日发布的开源旗舰级大模型，聚焦编程、推理与多场景适配，旨在实现与国际顶尖模型并驾齐驱的性能表现。

其名称中“GLM”是“General Language Model”（通用语言模型）的缩写，后缀“4.6”代表其为GLM 4系列的迭代版本，核心功能涵盖高阶编程开发、复杂物理模拟、长文本处理、图像识别及智能体任务等；官方使用门槛友好，个人用户可通过智谱MaaS平台bigmodel.cn免费试用，GLM Coding Plan推出20元包月套餐（仅为Claude同类套餐价格的1/7），API支持一定免费额度，无严格使用限制，同期发布的“兄弟模型”为性能更优的GLM 4.7，二者共同完善智谱高端模型矩阵。

目前GLM 4.6处于生命周期中的活跃阶段，未被淘汰，仍是智谱开源模型阵营的主力型号之一；其最突出的核心特点是“高性能与高性价比兼具”，在编程领域可媲美国际顶尖模型，同时通过开源和低价策略降低了开发者使用门槛。

二、发展历程

2.1 研发背景

GLM 4.6发布前，全球AI圈处于大模型竞速的关键阶段，主流模型呈现“闭源高端化、开源亲民化”的两极分化态势：国际端，Claude推出Sonnet 4.5、谷歌预告Gemini 3.0，主打高性能但订阅价格高昂且对国内用户不友好；国内端，DeepSeek发布V3.2-Exp实验版，智谱自身的GLM 4.5已实现性能突破但仍有短板，而多数国产模型要么性能不足，要么坚持闭源，难以满足开发者对“高性能+低成本+可定制”的需求。在此背景下，智谱AI为巩固国产模型优势、突破国际模型垄断、降低行业使用门槛，启动了GLM 4.6的研发，延续“提质降价”的迭代思路，补齐上一代模型的性能短板。

2.2 关键节点

智谱AI的大模型研发可追溯至2020年，当时推出GLM算法架构并尝试训练100亿参数基座模型，打破了当时BERT小模型横行的格局；2024年GLM 4系列正式落地，为后续迭代奠定基础。2025年7月底，GLM 4.5发布并取得阶段性成功，带动智谱MaaS平台API商业化增长10倍以上，随后研发团队迅速启动GLM 4.6的立项，聚焦编程性能、成本控制和多场景适配进行优化；2025年9月，模型完成内测，通过多项权威基准测试，确认性能超越同期多数国产模型及部分国际模型；9月30日，恰逢全球AI模型集中发布期，智谱AI正式对外发布GLM 4.6，同步宣布模型将开源至Hugging Face与ModelScope平台；发布后不久，寒武纪、摩尔线程等国产芯片厂商迅速完成模型适配，实现“国产大模型+国产芯片”的协同部署。

2.3 家族构成

GLM 4.6隶属于智谱GLM系列大模型，该家族自2021年开源GLM-10B模型以来，逐步形成覆盖不同参数、不同定位的完整矩阵，核心成员包括：

GLM-130B：百亿级参数基座模型，2022年发布，是GLM系列的里程碑产品，性能可匹敌GPT-3（davinci），为后续模型的技术迭代提供了核心架构支撑，主要面向企业级基础研发场景。

ChatGLM-6B：轻量级开源模型，2023年发布，仅62亿参数，支持消费级显卡本地部署，旨在降低大模型使用门槛，供个人开发者和小型团队免费试用、二次开发。

GLM 4：GLM 4系列的基础旗舰模型，2024年发布，支持128K上下文长度，在通用能力上可媲美GPT-4，分为基础版和All Tools版，后者支持网页浏览、Python解释器等工具调用，面向中高端个人及企业用户。

GLM 4.5：GLM 4.6的上一代模型，2025年7月底发布，首次将推理、编码、智能体能力融合，带动智谱商业化快速增长，是GLM系列从“追赶”到“并列”国际顶尖水平的关键过渡型号。

GLM 4.6：开源旗舰型号，定位“高性能+高性价比”，主打编程和物理模拟能力，开源后成为海外开发者关注的焦点，是GLM系列走向国际化的核心型号之一。

GLM 4.7：与GLM 4.6同期迭代的高端型号，性能更优，在多项评测中获得开源及国产模型SOTA，主打企业级高端场景，与GLM 4.6形成“开源亲民+高端商用”的互补格局。

三、核心技术剖析

3.1 固有技术

GLM 4.6继承了GLM系列模型的核心底层技术，延续了自回归填空任务架构，这是GLM家族区别于其他模型的核心特征，能够更精准地理解上下文语义，提升文本生成的连贯性；底层采用标准Transformer稠密架构，保障了模型的基础推理能力和可扩展性。同时，它沿用了上一代GLM 4.5的多阶段对齐手段，包括监督微调（SFT）和从人类反馈中学习（RLHF），确保模型输出符合人类意图，减少无意义回复；此外，还继承了FlashAttention技术和多查询注意力机制，前者提升了长文本处理效率，后者使推理速度较早期模型提升40%以上。

3.2 创新技术

GLM 4.6的核心创新的是“性能与成本的双重优化”，针对上一代模型的短板，推出多项实用创新，具体如下：

1. 上下文长度升级与token效率优化：将上下文长度从GLM 4.5的128K提升至200K，可一次性处理更复杂的项目代码、长篇文档等，解决了长文本处理中“遗忘关键信息”的痛点；同时优化token消耗逻辑，同类任务较上一代节省30%以上tokens，既提升了处理速度，又降低了用户使用成本。

2. 编程能力专项优化：采用“代码语料扩充+错误修复机制”双提升策略，扩充了6000亿以上代码标记训练数据，覆盖Python、C++、Java等10多个主流编程工具，同时引入实时错误反馈模型，能够快速识别并修正生成代码中的漏洞，在真实编程场景中，一次性可运行率反超Claude Sonnet 4.5 7个百分点。

3. 混合精度量化部署技术：首次在国内实现FP8+Int4混合量化推理部署，该技术可在不损失模型精度的前提下，大幅降低推理算力需求，配合国产芯片适配，进一步降低了模型部署的硬件成本，使量化版本可在消费级芯片（如M3 Ultra）上以每秒17个token以上的速度推理。

4. 多模态与泛化能力提升：新增图像识别和搜索能力，可实现SVG动画生成、3D场景模拟等复杂任务，解决了上一代模型在抽象需求理解上的不足；同时优化训练数据覆盖，提升了对冷门场景（如小众图形绘制、特殊物理模拟）的泛化能力，减少了“训练数据之外无法响应”的问题。

四、表现评估

4.1 历史与现状

GLM 4.6刚发布时，恰逢全球AI模型集中发布期，凭借开源、高性价比和出色的编程表现，迅速脱颖而出，发布后3天就在LMSYS Chatbot Arena Text Arena上综合排名全球第四，开源模型中排名第一，与阿里Qwen3-Max-Preview并列国内第一，打破了国际模型在开源领域的垄断。截至2026年4月，GLM 4.6仍是国内开源大模型中的主流选择，虽然其“兄弟模型”GLM 4.7在性能上实现超越，但GLM 4.6凭借开源免费、成本低廉的优势，依旧拥有庞大的用户群体，尤其在个人开发者和中小型企业中应用广泛，全球已有15万开发者使用其相关编程服务，海外影响力持续提升。

4.2 优势亮点

结合LMSYS Chatbot Arena、SuperCLUE、CC-Bench-V1.1等业内公认排行榜及媒体实测数据，GLM 4.6的优势主要集中在三个核心维度，表现突出：

1. 编程能力顶尖：在CC-Bench-V1.1评测中超过多款国产开源模型，在Factory AI的Terminal-Bench开源模型排名中位列第一，甚至超越Claude Sonnet 4；实测中，可生成736行Three.JS 3D射击游戏代码，流畅运行无明显bug，还能完成交互式太阳系模拟、SVG水豚骑自行车动画等复杂编程任务，代码一次性可运行率达94.9%，接近Claude Sonnet 4.5的96.2%，而价格仅为后者的1/7。

2. 性价比极高：个人用户可免费试用，包月套餐仅20元，企业版和GLM Coding Max版针对高频用户优化，用量是Claude Max (20x) plan的3倍，大幅降低了个人开发者和中小企业的使用成本；同时，通过FP8+Int4混合量化部署和国产芯片适配，进一步降低了部署成本，实现“低成本、高性能”的平衡。

3. 中文处理与泛化能力出色：在中文指令遵循率上，较Claude Sonnet 4.5领先9.4%，贴合国内用户使用习惯；在角色扮演、叙事创作等场景中，能够精准捕捉情感细微差别，角色逻辑连贯、外貌描述一致，避免了“积极性偏见”；在冷门场景测试中，表现优于GPT-5等国际模型，泛化能力稳定。

此外，在数学推理方面，GLM 4.6在2024年高考数学卷中取得142分的成绩，较Claude Sonnet 4.5高出18分，展现出较强的逻辑推理能力。

4.3 缺点与不足

客观来看，GLM 4.6仍存在明显短板，未达到“全能型”模型水平，主要不足集中在三个方面：

1. 长程上下文回忆仍有短板：虽然将上下文长度提升至200K，但在处理超长篇文档（如百万字小说、大型项目完整代码）时，仍会出现关键信息遗忘、逻辑断裂的问题，相较于Claude 3 Opus等国际顶尖模型，长文本处理的稳定性仍有差距。

2. 多轮逻辑推理能力不足：在复杂多轮推理任务中，容易出现推理步骤跳跃、结论偏差的问题，尤其是在涉及多领域交叉知识的推理场景中，表现不如Claude Sonnet 4.5和Gemini 2.5 Pro，难以完成高度复杂的智能体任务。

3. 部分场景存在幻觉：在处理小众领域专业知识（如冷门学术研究、特殊行业规范）时，偶尔会生成错误信息，出现“幻觉”现象；同时，在图像生成的细节处理上不够精准，如复杂图形的比例偏差、色彩失真等问题，多模态融合的细腻度有待提升。

五、重大事件

1. 2025年9月30日，GLM 4.6正式发布并开源，发布当天恰逢DeepSeek、Claude等厂商集中发布新模型，形成“AI黄金周竞速”局面，GLM 4.6凭借开源和高性价比，迅速引发行业关注，成为当天国产模型中的焦点。

2. 2025年10月，GLM 4.6在LMSYS Chatbot Arena排名中斩获开源模型全球第一、国内并列第一的成绩，这是国产开源模型首次在该榜单中超越同期国际开源模型，标志着国产大模型在编程领域实现重大突破。

3. 2025年10月起，GLM 4.6在海外爆火，X平台、Reddit、YouTube等社区出现大量开发者自发测评，多位AI领域KOL发文推荐，YouTube上相关深度测评视频达十几条，覆盖部署教程和实测体验，实现“墙内开花墙外香”，成为中国AI走向世界的典型案例。

4. 2025年10月，寒武纪、摩尔线程等国产芯片厂商完成GLM 4.6适配，寒武纪实现FP8+Int4混合量化部署，摩尔线程通过vLLM框架提升推理效率，形成“国产大模型+国产芯片”的协同生态，打破了国产模型对海外芯片的依赖。

5. 2026年1月，智谱AI在上市首日的内部信中明确表示，GLM 4.6与GLM 4.7共同推动智谱模型能力达到国际顶尖水平，带动MaaS平台ARR年化收入突破5亿，其中海外收入超过2亿，GLM 4.6成为推动智谱商业化增长的核心动力之一。

Question 2

GLM 4.6的API价格是多少？

Accepted Answer

GLM 4.6的API输入价格为2.8275元/百万Token，输出价格为13.7750元/百万Token。

Question 3

GLM 4.6支持哪些功能？

Accepted Answer

GLM 4.6的功能特性信息暂未收录。

Question 4

GLM 4.6是国产模型吗？

Accepted Answer

是的，GLM 4.6是由Zhipu开发的国产AI大模型，可直接访问使用。

GLM 4.6

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

📊
能力雷达星图

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API

平台：OpenRouter 模型：GLM 4.6

平台：SiliconFlow 模型：GLM-4.6

⚡ 体验反馈与渠道测速

🏛️ 官方渠道体验

🤝 第三方测速反馈

⚔️
性能对标产品

Hy3 preview(high)

Qwen3.6-27B(Thinking)

MiMo V2.5 Pro Base

MiMo V2.5 Base

社区真实评价