Qwen 3.5 Plus

Qwen 3.5 Plus

qwen-3-5-plus

机构/公司
未知机构(海外 🌍)
发布日期
2026-02-16
版本状态
⭐ 当前主力
开源状态
🌍 开源可见
能力模态
👁️ 多模态模型
上下文长度
1M
参数规模:397B
主要语言:中文
底层架构:MoE
开源协议:Apache 2.0
官方计费模式:参见下方【使用模块】

📖
词条百科 Wiki


# 一、简介与定位

Qwen 3.5 Plus是中国阿里巴巴通义千问团队于2026年2月16日除夕发布的新一代主力级MoE架构大模型,主打高性能、低成本、全场景通用能力,是Qwen3.5系列的核心主力版本。

后缀“Plus”代表该版本为Qwen3.5系列的高配主力通用版,区别于轻量化极速模型与全能多模态模型,核心聚焦文本推理、代码生成、智能Agent三大核心能力优化。该模型完全免费公开可用,千问APP、网页端、PC客户端无付费订阅门槛,开发者可通过阿里云API调用,拥有基础免费额度,仅超高量级调用会产生计费,无特殊使用限制。本次同期发布的兄弟模型包含主打全模态视听交互的Qwen 3.5 Omni、轻量化极速推理的Qwen 3.5 Flash以及多款开源小参数量版本。

目前Qwen 3.5 Plus处于模型生命周期的最新主力服役阶段,未被迭代淘汰,是阿里云对外商用、社区主流使用的核心模型。其最突出的核心特点为以小激活参数量实现越级性能,兼顾顶尖综合能力与极致推理性价比,打破了大模型参数越大性能越强的固有认知。

# 二、发展历程

# 2.1 研发背景

2025年末至2026年初,通用大模型市场进入性能同质化、成本高企的瓶颈期。行业主流模型呈现两极分化态势,头部闭源模型如GPT、Gemini综合性能顶尖,但调用成本高昂、本地化部署门槛极高;开源主流模型普遍存在推理能力薄弱、Agent智能化不足、多模态适配割裂的问题。同时,传统稠密架构大模型存在显存占用高、推理吞吐量低、大规模商用成本昂贵的痛点,而早期MoE模型又存在激活效率低、训练不稳定、通用能力不均衡的缺陷。在此行业局势下,阿里通义千问团队推出Qwen 3.5 Plus,旨在平衡顶级性能、低成本部署与全场景实用性,解决高端模型难落地、平价模型性能不足的行业痛点。

# 2.2 关键节点

Qwen3.5系列的迭代研发始于2025年下半年,团队基于Qwen3系列基座模型完成底层架构复盘与数据体系升级,重点优化MoE激活机制与多任务对齐能力。2026年1月,该模型完成内部多轮灰度内测,针对数学推理、代码逻辑、长文本记忆、Agent自主决策等短板进行专项微调优化,修复了前代模型的部分幻觉问题。2026年2月16日(除夕),阿里正式对外官宣发布Qwen3.5全系模型,其中Qwen 3.5 Plus作为核心主力版同步全量上线,面向普通用户与开发者全面开放使用权限。上线后数月内,团队持续推送小幅迭代更新,优化上下文稳定性与复杂场景适配能力,持续夯实商用落地能力。

# 2.3 家族构成

Qwen 3.5 Flash:轻量化极速推理版本,主打低延迟、高响应速度,参数量更小、算力消耗极低,核心适配日常闲聊、简单问答、短文本生成等轻量化场景,主打极致性价比与极速交互体验。

Qwen 3.5 Plus:系列核心主力通用版本,采用MoE混合架构,平衡性能与成本,综合推理、代码、Agent、文本处理能力拉满,适配绝大多数个人使用、企业商用、开发者二次开发场景,是全系适用性最广的版本。

Qwen 3.5 Omni:全能多模态版本,重点强化音视频理解、语音交互、跨模态推理能力,支持图文、音视频全场景输入输出,主打视听交互、复杂多模态创作与解析场景。

Qwen3.5开源小参数系列:包含2B、14B、27B等轻量化开源模型,主打本地化部署、免费二创、个性化微调,适配个人开发者、小型团队的离线使用与二次开发需求。

# 三、核心技术剖析

# 3.1 固有技术

Qwen 3.5 Plus继承了Qwen系列成熟的Transformer稠密基础架构,沿用标准化的多头注意力机制与层归一化设计,保障模型基础推理的稳定性与兼容性,适配主流大模型调用协议与部署框架。同时继承前代成熟的人类反馈对齐技术(RLHF)与AI反馈对齐技术(RLAIF),通过多维度偏好数据微调,保证模型输出符合人类认知逻辑,规避恶意输出、逻辑混乱等基础问题。此外,延续Qwen3系列的超大上下文窗口能力,原生支持256K超长文本上下文,继承了优秀的长文本基础记忆与解析能力,适配长篇文档总结、代码工程解析、长对话交互等场景。

# 3.2 创新技术

Qwen 3.5 Plus的核心创新集中在MoE架构优化、预训练体系升级、推理效率优化三大维度,彻底解决了前代模型的性能与成本矛盾,具体创新点如下:

(1)轻量化高效MoE混合专家架构

该模型总参数量达3970亿,但采用动态激活机制,常规场景仅激活170亿参数参与计算,区别于传统稠密模型全参数运算、传统MoE模型激活冗余的问题。简单来说,模型会根据用户输入场景自动调用对应专业“专家模块”,简单任务低参数高效运算,复杂任务调动多模块协同,最终实现显存占用降低60%,256K长文本场景下推理吞吐量最高提升19倍,在大幅降低部署与调用成本的同时,实现越级性能输出。

(2)文图统一混合预训练体系

区别于前代模型文本、视觉数据分开训练的模式,Qwen 3.5 Plus采用文本+视觉混合Token统一预训练,让文本理解、逻辑推理与视觉感知能力深度融合。不再是单纯的文本大模型附加视觉插件,而是原生具备图文联动理解能力,可直接解析手绘草图、截图代码界面、图文结合的复杂问题,实现草图转前端代码、图文联动推理等落地能力,弥补了传统文本大模型多模态适配生硬的短板。

(3)全场景推理数据增量优化

团队大幅扩充中英文通识知识、STEM理工科、数理逻辑、多步骤推理、Agent决策类高质量训练数据,针对性强化博士级难题解析、复杂代码逻辑、自主任务规划能力。相较于前代模型,其多步骤链式推理的准确率显著提升,能够自主拆解复杂任务、规避逻辑断层,解决了传统开源大模型“简单问题精准、复杂推理拉胯”的通病。

(4)低成本高稳定推理优化方案

通过架构精简、算力调度优化与参数蒸馏技术,模型大幅降低商用调用成本,API调用单价低至每百万Token 0.8元,同时保障高并发场景下的输出稳定性,不会因批量调用出现卡顿、输出残缺、逻辑错乱的问题,大幅提升了企业级落地的可行性。

# 四、表现评估

# 4.1 历史与现状

2026年2月首发阶段,Qwen 3.5 Plus上线即登顶同期开源大模型综合性能榜单,多项核心评测指标超越同阶段主流闭源模型,凭借“低价高性能”的特性迅速成为行业标杆。上线数月后,其行业地位依旧稳固,在开源通用大模型赛道中,综合推理、代码、Agent能力处于第一梯队,虽然后续有多款轻量化模型迭代推出,但暂无同价位、同定位模型能全面超越其综合实力,仍是个人用户使用、中小企业商用、开发者二次开发的优选模型。

# 4.2 优势亮点

结合LMSYS Chatbot Arena、SuperCLUE、GPQA、MMLU-Pro等业内权威评测基准,Qwen 3.5 Plus的核心优势集中在四大维度:

(1)高阶知识推理能力顶尖:在MMLU-Pro专业知识推理评测中得分87.8分,超越同期主流闭源模型;在GPQA博士级难题测评中斩获88.4分,理工科高阶问题解析、专业知识问答准确率大幅领先同级开源模型,适合学术研究、专业咨询等高精度场景。

(2)指令遵循与Agent能力突出:在IFBench指令遵循评测中以76.5分刷新同期模型纪录,能够精准理解复杂、模糊、多约束的用户指令。同时在BFCL-V4、Browsecomp等通用及搜索Agent评测中表现优异,可自主完成多步骤任务规划、跨应用操作、自动化流程执行,智能化落地能力远超传统开源模型。

(3)代码生成与落地性极强:支持全品类编程语言的代码生成、纠错、重构与注释优化,依托图文融合能力,可直接将手绘界面草图转化为完整可用的前端代码,兼顾代码规范性、逻辑性与实用性,适配开发者日常编码、项目落地等场景。

(4)性价比优势断层领先:以不足40%的激活参数量,实现性能超越万亿参数的Qwen3-Max模型,推理效率、部署成本全面优化,API调用价格远低于同级闭源模型,是目前商用落地性价比最高的通用大模型之一。

# 4.3 缺点与不足

客观实测下,Qwen 3.5 Plus存在三处明显短板,无过度优化公关偏差:

(1)极致数学运算精度不足:面对超高精度数理推导、复杂公式迭代、纯抽象数学证明等极端场景,相较于顶级闭源模型仍存在差距,偶尔出现步骤简化、细节推导疏漏的问题,不适合顶尖科研级数学运算场景。

(2)超长文本细节遗忘偶发:虽然支持256K超长上下文,但在接近上下文上限的超长篇幅文档解析、多章节交叉关联推理场景中,会轻微出现远端细节信息遗忘、前后逻辑呼应偏差的问题,稳定性略逊于专业长文本模型。

(3)小众场景幻觉无法杜绝:在冷门小众知识、细分垂直领域、小众行业规范等低数据场景下,依然会出现轻微事实幻觉,存在虚构细节、错误溯源的情况,无法完全满足高精度垂直领域专业落地需求。

# 五、重大事件

1. 除夕重磅发布,引爆AI行业热度

2026年2月16日除夕,阿里通义千问正式发布Qwen3.5全系模型,其中Qwen 3.5 Plus凭借越级性能、极致性价比成为行业焦点,上线后迅速登顶科技热搜,被业内定义为“开源大模型性价比天花板”,引发全网AI从业者、开发者大规模讨论。

2. 多项权威评测刷新开源纪录

模型发布后,在MMLU-Pro、GPQA、IFBench、BFCL-V4等215项第三方权威评测任务中取得SOTA最优成绩,多项指标超越同期GPT、Claude、Gemini主流闭源模型,打破了开源模型性能普遍弱于闭源模型的固有认知,重塑开源大模型性能标杆。

3. 触发行业大模型性价比内卷浪潮

Qwen 3.5 Plus以超低调用成本、越级综合性能,大幅拉低了高端大模型的商用落地门槛,直接推动2026年上半年通用大模型行业降价、性能升级的内卷趋势,让高性能大模型从高端商用场景走向中小团队与个人用户。

4. 开源社区大规模二创迭代

依托Qwen3.5系列开源小模型的开放能力,全球开源社区快速涌现海量微调、二次开发、本地化部署方案,衍生出适配办公、教育、编程、自媒体等多个垂直场景的定制化模型,极大丰富了国产大模型的落地生态。

# 六、局限与妥协

Qwen 3.5 Plus为纯国产合规大模型,无海外IP封锁、付费门槛、合规使用壁垒等客观局限,国内个人用户、开发者、企业均可合规免费或低成本正常使用,本部分省略。

由本站联合社区极客共同编撰,最后更新:2026-05-21 02:52:23
开放 Wiki 模式开启中

📊
能力雷达星图

权威基准

数据采集中

该模型太新啦!百科已抢先收录基础档案,权威雷达图评测数据正在快马加鞭测试中。

模型家族构成

🔗 相关链接

词条待补全

没有找到体验地址?去反馈!

💻
使用与反馈

💰 计费模式与方案

体验反馈与渠道测速

⚔️
性能对标产品

AI

Hy3 preview(high)

Unknown
Qwen3.6-27B(Thinking)

Qwen3.6-27B(Thinking)

Qwen
MiMo V2.5 Pro Base

MiMo V2.5 Pro Base

Xiaomi
MiMo V2.5 Base

MiMo V2.5 Base

Xiaomi
💬

社区真实评价

🤐

登录后才能发表评价,与极客们一起交流哦~

正在拉取评论数据...