Qwen3.6 35B

Qwen3.6 35B

qwen-3-6-35b

机构/公司
alibaba(国内 🇨🇳)
发布日期
2026-04-14
版本状态
⭐ 当前主力
开源状态
🌍 开源可见
能力模态
👁️ 多模态模型
上下文长度
262K
参数规模:35B
主要语言:中文
底层架构:MoE
开源协议:Apache 2.0
官方计费模式:参见下方【使用模块】

📖
词条百科 Wiki


# 一、简介与定位

中国阿里通义千问团队于2026年4月17日发布的开源稀疏MoE高效主力大模型,是Qwen3.6系列首款面向社区开放权重的商用级模型。

模型全称Qwen3.6-35B-A3B,后缀35B代表模型总参数量350亿,A3B为阿里自研稀疏架构标识,特指35B总参数、30亿激活参数的混合专家配置,核心主打智能体编程与轻量化多模态推理。该模型完全开源免费,个人与企业可免费下载权重本地部署,阿里云百炼API提供对应调用接口,无强制订阅门槛、无基础调用次数限制;同期官方还发布了Qwen3.6-Plus等闭包旗舰模型,形成高低搭配的产品矩阵。

该模型目前处于Qwen3.6系列主力迭代、持续维护的生命周期阶段,未被迭代淘汰,核心突出特点是用极小激活算力,实现了越级的智能体编程与多模态综合能力,是中小规模开源模型中“高效能、低成本”的标杆产品。

# 二、发展历程

# 2.1 研发背景

在Qwen3.6 35B发布前,开源大模型市场呈现两极分化格局:一方面是20B-30B级稠密模型,推理算力消耗高、部署成本昂贵,难以适配轻量化终端与边缘场景;另一方面是同期主流稀疏MoE模型,大多存在智能体任务适配差、代码工程能力薄弱、多模态推理精度不足的痛点。同时,行业内Gemma4系列等同级竞品,普遍存在真实落地场景适配性弱、复杂多步编程任务准确率低的问题。基于行业对“低成本、高性能、可落地”开源模型的刚需,阿里推出Qwen3.6 35B-A3B,针对性解决中小模型算力冗余、实用能力短板的行业痛点。

# 2.2 关键节点

阿里在完成Qwen3.5系列MoE模型的落地验证后,启动Qwen3.6轻量化迭代研发,重点优化智能体编码、多模态空间推理与长对话留存能力。2026年4月上旬,该模型完成内部多轮基准测试与场景打磨,多项核心指标超越前代Qwen3.5-35B-A3B及同级竞品。2026年4月17日,官方正式对外开源发布Qwen3.6-35B-A3B,同步上线Qwen Studio在线体验、阿里云百炼API调用渠道,同时开放Hugging Face、ModelScope权重下载通道,面向全社区开放商用权限。

# 2.3 家族构成

Qwen3.6-Plus:Qwen3.6系列旗舰闭源模型,主打极致综合推理、复杂逻辑运算与高阶创作能力,面向企业高端商用场景,无开源权重,仅支持API调用,定位高端算力服务市场。

Qwen3.6-35B-A3B:系列核心开源主力模型,主打轻量化高效推理、智能体编程与原生多模态能力,平衡性能与部署成本,适配个人开发者、中小企业落地及边缘部署场景,是当前系列普及度最高的版本。

Qwen3.6-Flash:系列极速推理API版本,基于35B模型内核优化推理链路,主打低延迟、高并发调用,适配高频对话、实时交互等轻量化线上服务场景。

# 三、核心技术剖析

# 3.1 固有技术

该模型继承了Qwen系列成熟的底层技术体系,沿用Transformer稀疏MoE基础架构,延续前代模型的预训练数据清洗体系与通用对齐范式。在基础能力上,继承了Qwen系列优秀的中文语义理解、通用知识储备与基础代码生成能力,同时保留256K超长上下文窗口配置、多轮对话基础对齐策略,兼容主流大模型调用协议与开源部署框架,保证了模型的稳定性与生态兼容性。

# 3.2 创新技术

本次迭代核心创新集中在稀疏架构优化、智能体能力强化与对话留存优化,全部为实用向技术升级,无噱头式迭代,具体如下:

1. 精细化MoE专家路由机制:模型内置256个专家网络,推理时仅固定激活8个路由专家+1个共享专家,实现35B总参数、3B激活参数的极致配比。简单来说,模型储备了百亿级知识储备,但每次对话、编码推理仅调用少量核心参数,大幅降低显存占用与推理耗时,解决了传统大模型“参数大、算力高、落地难”的问题,实现小算力撬动高性能。

2. 原生Agentic Coding智能体编程优化:区别于普通代码生成模型,该模型新增仓库级代码推理、多步工程任务联动能力,支持终端操作、文件编辑、工作流编排等复杂实操任务。通过专项代码微调配方,优化了长代码逻辑衔接、跨文件调用、BUG自查修复能力,在真实开发场景的适配性远超同级开源模型。

3. Thinking Preservation思维留存机制:首创多轮对话推理链保留功能,在迭代式开发、多轮需求优化等场景中,可完整留存历史推理过程与思考逻辑,无需重复梳理前置逻辑。有效减少多轮交互中的重复思考开销,大幅提升长期任务迭代的连贯性与效率。

4. 轻量化多模态融合架构:摒弃拼接式多模态改造,内置原生视觉编码器,实现图文、视频、空间信息的统一理解。重点强化空间智能推理能力,在物体定位、空间布局、图文公式解析等场景精度显著提升,多模态综合表现可对标高端闭源模型。

# 四、表现评估

# 4.1 历史与现状

模型发布初期,凭借“3B激活参数越级打榜”的特性,直接刷新了中小开源MoE模型的性能纪录,在代码智能体、多模态推理维度超越Gemma4同级模型、前代Qwen3.5系列模型。截至目前,在20B-40B开源模型赛道中,仍保持第一梯队地位,尤其在落地实用性、算力性价比、智能体工程能力上具备明显竞争优势,未被后续同级别新模型超越,是当前工业界轻量化部署的首选模型之一。

# 4.2 优势亮点

结合官方基准测试与业内通用评测榜单,该模型核心优势集中在三大维度,数据表现真实可溯源:

1. 智能体编程能力越级领先:在SWE-bench Verified、Terminal-Bench 2.0等权威代码榜单中得分75.0、41.6,大幅超越前代Qwen3.5-35B-A3B,部分指标媲美数百亿级稠密大模型。擅长仓库级代码生成、终端指令操作、多步骤工程任务落地,适配真实软件开发全流程。

2. 多模态推理精度突出:在MMBench、OmniDocBench等多模态评测中表现优异,OMNI文档理解得分89.9,空间推理RefCOCO得分92.0,多项任务指标超越Claude Sonnet 4.5,擅长文档解析、空间识别、图文结合推理、短视频内容理解。

3. 中文与通用知识能力扎实:C-Eval中文评测得分90.5、MMLU-Pro通用知识得分86.1,继承通义千问系列本土化优势,对中文语境、行业术语、本土常识的理解精准度高,适配国内各类办公、咨询、内容创作场景。

4. 极致算力性价比:同等性能下,推理算力消耗仅为传统27B稠密模型的1/10左右,支持普通消费级显卡轻量化部署,兼顾性能与落地成本,是开源模型中性价比天花板。

# 4.3 缺点与不足

客观实测存在多处明显短板,无过度优化渲染:

1. 高阶数学推理存在短板:基础数理运算表现稳定,但在复杂奥数、高阶微积分、多步骤数理证明等STEM硬核任务中,得分低于顶级稠密大模型,容易出现步骤逻辑断层、最终结果偏差的问题,不适合专业科研级数理计算场景。

2. 超长文本细节遗忘问题:虽支持256K上下文窗口,但在接近满负载超长文本解析、百万字级文档精读场景中,仍存在尾部细节信息遗忘、跨章节逻辑衔接失误的情况,长文本精准检索能力弱于超大参数闭源模型。

3. 极端复杂智能体任务容错率低:面对超复杂多分支工程任务、跨领域多工具联动任务时,偶尔出现路径规划失误、指令执行中断的问题,相较于顶级闭源模型,自主纠错与动态调整能力不足。

4. 幻觉问题未完全根除:小众行业知识、冷门技术文档、小众开源工具相关问答中,存在少量事实幻觉,会虚构参数、用法与案例,专业领域落地仍需人工校验。

# 五、重大事件

1. 轻量化MoE模型性能标杆出圈:2026年4月发布后,凭借“3B激活参数越级对标百亿模型”的表现,快速登顶AI开源社区热度榜,被业内定义为中小模型高效落地的新标准,大量开发者批量部署实测,成为短期开源社区最热门的代码类大模型。

2. 兼容主流编码生态引发社区二创热潮:模型原生适配OpenClaw、Claude Code、Qwen Code等主流AI编码工具,开源后社区快速涌现大量二次开发项目,包括轻量化代码助手、终端智能运维工具、本地部署优化方案等,大幅拓展了中小模型的工程落地场景。

3. 多项评测超越国际顶级闭源模型引发行业讨论:发布后实测数据显示,其多模态空间推理、终端编程任务表现超越Claude Sonnet 4.5,打破了“开源中小模型综合能力弱于闭源高端模型”的固有认知,引发业内关于稀疏MoE架构价值的深度讨论。

4. 成为中小企业轻量化商用首选模型:凭借完全开源、免费商用、低算力成本的优势,上线后快速被大量中小企业应用于代码开发、智能客服、图文解析等业务场景,成为2026年上半年落地率最高的国产开源大模型之一。

# 六、局限与妥协

Qwen3.6 35B-A3B为纯国产合规开源模型,无海外使用壁垒、IP限制、付费门槛等客观局限,可直接国内合规部署、商用,本部分予以省略。

由本站联合社区极客共同编撰,最后更新:2026-05-20 00:19:11
开放 Wiki 模式开启中

📊
能力雷达星图

权威基准

数据采集中

该模型太新啦!百科已抢先收录基础档案,权威雷达图评测数据正在快马加鞭测试中。

模型家族构成

🔗 相关链接

词条待补全

没有找到体验地址?去反馈!

💻
使用与反馈

💰 计费模式与方案

体验反馈与渠道测速

⚔️
性能对标产品

AI

Hy3 preview(high)

Unknown
Qwen3.6-27B(Thinking)

Qwen3.6-27B(Thinking)

Qwen
MiMo V2.5 Pro Base

MiMo V2.5 Pro Base

Xiaomi
MiMo V2.5 Base

MiMo V2.5 Base

Xiaomi
💬

社区真实评价

🤐

登录后才能发表评价,与极客们一起交流哦~

正在拉取评论数据...