# 一、简介与定位
小米(中国)科技公司于2026年4月22日深夜发布的新一代全模态开源旗舰级大模型,主打智能体长程任务与超高Token效率,是小米MiMo系列快速迭代的主力升级版本。
该版本后缀V2.5为系列迭代升级标识,无特殊语义,核心是补齐前代模型的长文本推理、复杂工具调用、自主纠错短板,新增极致轻量化推理优化能力。官方使用门槛极低,核心通用版MiMo V2.5、旗舰版V2.5-Pro均基于宽松MIT协议开源,支持个人与企业免费商用、微调、二次分发;小米同步开放云端API服务,推出百万级免费Token激励计划,无硬性订阅门槛,仅高阶批量算力服务需付费。本次同期发布的兄弟模型包含专项语音赛道的V2.5-TTS Series(语音合成)、V2.5-ASR(语音识别)两款垂直模型。
目前MiMo V2.5系列为小米MiMo大模型家族最新主力迭代版本,尚未推出替代升级版,是当前小米AI生态落地、开发者开源适配、终端智能体部署的核心基座。其最突出的核心特点是,以轻量化激活参数实现百万级超长上下文,兼顾顶级Agent长程任务能力与行业领先的Token使用效率,大幅降低复杂AI任务的落地成本。
# 二、发展历程
# 2.1 研发背景
2026年上半年,国内大模型赛道全面进入Agent智能体竞争时代,行业主流模型呈现两极分化的痛点。一方面,闭源旗舰模型如GPT、Claude系列长任务能力顶尖,但推理成本高昂、调用门槛高、商用限制多;另一方面,多数国产开源模型普遍存在长文本遗忘、多轮工具调用稳定性差、复杂代码任务落地能力不足、Token利用率低下的问题。同时,行业内模型迭代速度加快,智谱GLM-5.1、Kimi K2.6、DeepSeek V4等新品密集发布,市场亟需一款兼顾顶级Agent能力、低成本、全开源、适配国产算力的通用大模型。小米MiMo V2.5正是在行业从对话式AI向自主智能体AI转型、国产开源模型竞争白热化的局势下,为补齐长程任务、高效推理、低成本商用短板而迭代诞生。
# 2.2 关键节点
小米MiMo大模型自2025年底开启快速迭代周期,为V2.5版本奠定了完善的技术基础。2025年12月,小米推出MiMo V2-Flash轻量模型,验证了轻量化高效推理架构;2026年3月18日,小米正式发布MiMo V2系列主力模型,完成全模态能力初步落地,构建了基础Agent技术框架。时隔仅36天,2026年4月22日深夜,小米官宣迭代升级的MiMo V2.5全系列模型,次日正式开启全网公测,面向个人用户与开发者开放体验。2026年4月28日,小米兑现预告,开源MiMo V2.5、V2.5-Pro两大核心模型,同步上线Orbit百万亿Token激励计划,全面开放商用与二次开发权限,快速完善生态布局。
# 2.3 家族构成
MiMo V2.5是小米MiMo大模型家族的迭代升级系列,当前家族核心成员定位清晰,覆盖轻量化、主力通用、旗舰高阶、垂直语音四大场景,形成完整产品矩阵。
MiMo V2-Flash:2025年12月发布的轻量迭代版本,主打极速推理、低算力消耗,适配手机、IoT设备等终端轻量化部署,适合日常对话、简单指令执行等轻量级AI场景,为后续版本的高效推理架构提供技术验证。
MiMo V2 基础版/Pro版:2026年3月发布的上一代主力模型,搭建了MiMo全模态基础架构,初步具备多模态理解、基础工具调用能力,核心服务于小米人车家全生态的基础AI需求,是V2.5版本的技术基座。
MiMo V2.5(通用版):2026年4月发布的新一代主力通用模型,原生支持全模态交互,兼顾推理速度与综合性能,适配绝大多数通用AI场景、终端智能体部署与中小开发者商用需求。
MiMo V2.5-Pro(旗舰版):系列高阶核心版本,主打长程复杂Agent任务、高阶代码工程、千轮级稳定工具调用,综合性能对标国际顶尖闭源模型,面向企业级复杂开发、专业AI生产力场景。
MiMo V2.5-TTS/ASR:垂直语音专项模型,分别聚焦高精度语音合成、实时语音识别,补齐系列语音交互短板,适配直播配音、实时转写、智能座舱语音交互等垂直场景。
# 三、核心技术剖析
# 3.1 固有技术
MiMo V2.5系列完整继承了上一代V2系列的成熟底层技术架构,保障了模型稳定性与兼容性。架构层面沿用优化版Transformer混合架构,保留通用文本、视觉、音频多模态融合编码机制,实现图文音视频一体化理解与交互。对齐层面延续小米自研的人类反馈强化学习对齐方案,继承前代精准的指令遵循、上下文适配能力,规避了早期国产模型常见的指令跑偏、答非所问问题。同时继承了终端轻量化适配技术,可兼容小米自研芯片及主流终端设备,保留IoT、车载场景的底层适配逻辑,保障模型在软硬件生态中的落地稳定性。
# 3.2 创新技术
MiMo V2.5系列核心创新聚焦长程Agent稳定性、Token效率优化、自主纠错迭代三大维度,针对性解决行业主流模型的核心痛点,技术落地性极强,无冗余噱头功能。
(1)百万级超长上下文无损记忆技术
该系列全系原生支持100万Token超长上下文窗口,核心优化了传统大模型长文本遗忘、上下文冗余、后期逻辑错乱的问题。通过动态上下文压缩与重点信息锚定机制,模型可在近千轮连续工具调用、数十小时长流程任务中,精准留存核心任务目标、前期操作逻辑与关键数据,不会因上下文过长出现信息丢失、逻辑断层。区别于多数模型单纯扩充Token上限的做法,MiMo V2.5通过权重动态刷新机制,过滤无效冗余信息,保留核心有效信息,兼顾长文本容量与推理速度。
(2)高利用率Token精简推理机制
这是该版本最核心的落地创新,主打低消耗、高性能的推理优化。模型重构了Token编码与推理逻辑,剔除无效Token输出、精简冗余语义表达,在同等任务精度下,相比Kimi K2.6节省42%Token消耗,相比Muse Spark节省50%Token消耗。简单来说,完成一模一样的复杂任务,MiMo V2.5所需的计算资源、调用Token数量大幅减少,直接降低开发者与企业的商用成本,解决了高端Agent模型算力消耗过高的行业痛点。
(3)长程任务自主诊断与纠错架构
针对复杂工程、代码开发、多步骤智能体任务容易出现局部错误、中途崩盘的问题,V2.5系列新增自主工作纠错机制。模型在千轮级工具调用、长周期任务执行中,可实时自检每一步操作的合理性,自动诊断代码漏洞、逻辑偏差、操作失误,无需人工干预即可完成回退、重构、修正并继续推进任务。官方测试中,该模型可自主完成数千行代码项目开发、完整编译器搭建,全程自主纠错、迭代优化,大幅提升复杂生产力任务的落地成功率。
(4)轻量化MoE混合专家架构优化
旗舰版V2.5-Pro采用3090亿总参数MoE架构,优化了前代专家激活逻辑,实现大参数底座、小激活消耗。模型日常推理仅激活约150亿核心参数,既保留了千亿级模型的高阶推理、复杂决策能力,又规避了大参数模型推理慢、算力成本高的问题,推理成本仅为国际主流旗舰闭源模型的2.5%,实现性能与成本的极致平衡。
# 四、表现评估
# 4.1 历史与现状
MiMo V2.5发布之初,凭借极致的Agent长任务能力与超高Token效率,迅速跻身全球开源大模型第一梯队,在Artificial Analysis、GDPVal-AA、Claw-Eval等权威榜单中位列开源模型全球第一,综合智能指数冲入全球大模型总榜前五,是当时唯一可对标国际顶尖闭源模型的国产开源模型。截至目前,该版本依旧是小米最强开源主力模型,在国产Agent赛道、长文本复杂任务赛道保持核心竞争力,虽后续行业新品持续迭代,但V2.5的Token效率、低成本商用优势仍未被全面超越,是中小开发者商用落地的优选模型。
# 4.2 优势亮点
结合业内主流权威评测榜单与实测数据,MiMo V2.5系列核心优势集中在Agent任务、代码工程、长文本推理、成本控制四大维度,优势具象且落地性强。
(1)Agent长程任务能力行业顶尖
在Claw-Eval、SWE-Bench Pro等专业智能体、代码评测基准中表现优异,V2.5-Pro在SWE-Bench Pro取得57.2分,无限接近Claude Opus 4.6的57.3分。可稳定完成千轮级连续工具调用、数十小时长周期自主任务,从零搭建完整编译器、Web应用等复杂工程任务,自主纠错、流程管控能力远超多数国产开源模型。
(2)代码工程能力大幅跃升
依托MiMo Coding Bench专项评测,V2.5-Pro得分73.7分,大幅超越前代V2-Pro,缩小与国际顶尖模型的差距。不仅支持基础代码生成、纠错、调试,还具备完整工程项目开发、架构设计、全流程落地能力,可独立完成数千行完整代码项目,适配专业开发场景。
(3)Token效率与成本优势碾压同级
这是该模型最核心的差异化优势,在同等任务效果下,相比国内外主流开源、闭源模型实现超40%的Token消耗节省,搭配小米低价计费方案与免费Token激励,大幅降低AI开发、批量调用、终端部署的成本,商用性价比行业领先。
(4)软硬件适配度极高
开源首日即完成阿里平头哥、昆仑芯、AMD等国内外主流算力芯片适配,兼容SGLang、vLLM等主流推理框架,支持全场景快速部署,无论是云端商用、终端轻量化落地还是本地私有化部署,都具备极强的兼容性。
# 4.3 缺点与不足
客观来看,MiMo V2.5系列存在明显短板,并非全能型模型,缺陷集中在基础数理、小众场景适配、极限多模态精度层面。
(1)高阶数理推理能力偏弱
相较于顶尖闭源模型,该模型在高等数学推导、复杂数理证明、硬核逻辑推理竞赛题型上表现一般,专项数理评测分数低于GPT、Claude同代旗舰,更适配应用型任务而非科研级数理研究场景。
(2)小众多模态场景精度不足
虽然支持全模态交互,但在高精度图像细节解析、专业音频降噪识别、复杂视频帧逻辑拆解等小众垂直多模态场景,精度略低于专注多模态的专项模型,存在细节识别偏差、语义解读不精准的问题。
(3)极限超高并发稳定性一般
在企业级十万级超高并发批量调用场景下,偶尔出现推理延迟波动、少量请求响应偏差的问题,相较于百度文心、阿里通义等深耕商用稳定性的模型,大规模云端部署的容错能力仍有提升空间。
# 五、重大事件
1. 36天极速迭代,刷新国产大模型更新速度
2026年3月小米发布MiMo V2系列后,仅间隔36天就推出V2.5全系列迭代版本,以“一月一更”的高频迭代速度刷新国产头部大模型更新纪录,凸显小米AI赛道的技术迭代效率与资源投入力度,引发行业对大模型迭代节奏的热议。
2. 开源登顶全球榜单,跻身国际第一梯队
MiMo V2.5-Pro发布后,在Artificial Analysis、GDPVal-AA、Claw-Eval多项权威榜单中位列全球开源大模型第一,综合实力进入全球所有大模型总榜前五,成为2026年上半年国产开源大模型的标杆产品,打破国际顶尖模型的性能垄断。
3. 宽松MIT开源+百万亿Token激励,引爆开发者生态
2026年4月28日,小米开源V2.5核心版本,采用无商用限制的MIT宽松协议,同步启动Orbit百万亿Token激励计划,免费开放海量算力资源。超低的商用门槛吸引全球大量开发者二创、适配与落地,快速构建起庞大的MiMo开源生态。
4. 实战对标国际旗舰,验证国产Agent硬核实力
官方公开多项极限实测案例,V2.5-Pro可自主完成编译器开发、完整Web视频编辑器搭建等高难度工程任务,效率远超人工,性能无限接近Claude Opus 4.6、GPT-5.4等国际闭源旗舰模型,让国产开源Agent模型的实战能力得到行业广泛认可。
5. 全栈软硬件适配,推动国产AI算力生态协同
V2.5系列实现全系国产推理芯片、主流开源推理框架的首日适配,打通模型、算力、部署全链路,有效推动国产AI软硬件协同迭代,成为国产算力生态适配最完善的开源大模型之一。
# 六、局限与妥协
MiMo V2.5为纯国产合规大模型,无海外使用壁垒、IP限制、海外支付门槛等问题,国内用户、开发者、企业可无障碍免费体验、开源部署与商用落地,因此本部分内容省略。
社区真实评价
登录后才能发表评价,与极客们一起交流哦~