Name: MiMo V2.5
Rating: 69 (1 reviews)
Author: xiaomi

Question 1

MiMo V2.5是什么？

Accepted Answer

一、简介与定位

小米（中国）科技公司于2026年4月22日深夜发布的新一代全模态开源旗舰级大模型，主打智能体长程任务与超高Token效率，是小米MiMo系列快速迭代的主力升级版本。

该版本后缀V2.5为系列迭代升级标识，无特殊语义，核心是补齐前代模型的长文本推理、复杂工具调用、自主纠错短板，新增极致轻量化推理优化能力。官方使用门槛极低，核心通用版MiMo V2.5、旗舰版V2.5-Pro均基于宽松MIT协议开源，支持个人与企业免费商用、微调、二次分发；小米同步开放云端API服务，推出百万级免费Token激励计划，无硬性订阅门槛，仅高阶批量算力服务需付费。本次同期发布的兄弟模型包含专项语音赛道的V2.5-TTS Series（语音合成）、V2.5-ASR（语音识别）两款垂直模型。

目前MiMo V2.5系列为小米MiMo大模型家族最新主力迭代版本，尚未推出替代升级版，是当前小米AI生态落地、开发者开源适配、终端智能体部署的核心基座。其最突出的核心特点是，以轻量化激活参数实现百万级超长上下文，兼顾顶级Agent长程任务能力与行业领先的Token使用效率，大幅降低复杂AI任务的落地成本。

二、发展历程

2.1 研发背景

2026年上半年，国内大模型赛道全面进入Agent智能体竞争时代，行业主流模型呈现两极分化的痛点。一方面，闭源旗舰模型如GPT、Claude系列长任务能力顶尖，但推理成本高昂、调用门槛高、商用限制多；另一方面，多数国产开源模型普遍存在长文本遗忘、多轮工具调用稳定性差、复杂代码任务落地能力不足、Token利用率低下的问题。同时，行业内模型迭代速度加快，智谱GLM-5.1、Kimi K2.6、DeepSeek V4等新品密集发布，市场亟需一款兼顾顶级Agent能力、低成本、全开源、适配国产算力的通用大模型。小米MiMo V2.5正是在行业从对话式AI向自主智能体AI转型、国产开源模型竞争白热化的局势下，为补齐长程任务、高效推理、低成本商用短板而迭代诞生。

2.2 关键节点

小米MiMo大模型自2025年底开启快速迭代周期，为V2.5版本奠定了完善的技术基础。2025年12月，小米推出MiMo V2-Flash轻量模型，验证了轻量化高效推理架构；2026年3月18日，小米正式发布MiMo V2系列主力模型，完成全模态能力初步落地，构建了基础Agent技术框架。时隔仅36天，2026年4月22日深夜，小米官宣迭代升级的MiMo V2.5全系列模型，次日正式开启全网公测，面向个人用户与开发者开放体验。2026年4月28日，小米兑现预告，开源MiMo V2.5、V2.5-Pro两大核心模型，同步上线Orbit百万亿Token激励计划，全面开放商用与二次开发权限，快速完善生态布局。

2.3 家族构成

MiMo V2.5是小米MiMo大模型家族的迭代升级系列，当前家族核心成员定位清晰，覆盖轻量化、主力通用、旗舰高阶、垂直语音四大场景，形成完整产品矩阵。

MiMo V2-Flash：2025年12月发布的轻量迭代版本，主打极速推理、低算力消耗，适配手机、IoT设备等终端轻量化部署，适合日常对话、简单指令执行等轻量级AI场景，为后续版本的高效推理架构提供技术验证。

MiMo V2 基础版/Pro版：2026年3月发布的上一代主力模型，搭建了MiMo全模态基础架构，初步具备多模态理解、基础工具调用能力，核心服务于小米人车家全生态的基础AI需求，是V2.5版本的技术基座。

MiMo V2.5（通用版）：2026年4月发布的新一代主力通用模型，原生支持全模态交互，兼顾推理速度与综合性能，适配绝大多数通用AI场景、终端智能体部署与中小开发者商用需求。

MiMo V2.5-Pro（旗舰版）：系列高阶核心版本，主打长程复杂Agent任务、高阶代码工程、千轮级稳定工具调用，综合性能对标国际顶尖闭源模型，面向企业级复杂开发、专业AI生产力场景。

MiMo V2.5-TTS/ASR：垂直语音专项模型，分别聚焦高精度语音合成、实时语音识别，补齐系列语音交互短板，适配直播配音、实时转写、智能座舱语音交互等垂直场景。

三、核心技术剖析

3.1 固有技术

MiMo V2.5系列完整继承了上一代V2系列的成熟底层技术架构，保障了模型稳定性与兼容性。架构层面沿用优化版Transformer混合架构，保留通用文本、视觉、音频多模态融合编码机制，实现图文音视频一体化理解与交互。对齐层面延续小米自研的人类反馈强化学习对齐方案，继承前代精准的指令遵循、上下文适配能力，规避了早期国产模型常见的指令跑偏、答非所问问题。同时继承了终端轻量化适配技术，可兼容小米自研芯片及主流终端设备，保留IoT、车载场景的底层适配逻辑，保障模型在软硬件生态中的落地稳定性。

3.2 创新技术

MiMo V2.5系列核心创新聚焦长程Agent稳定性、Token效率优化、自主纠错迭代三大维度，针对性解决行业主流模型的核心痛点，技术落地性极强，无冗余噱头功能。

（1）百万级超长上下文无损记忆技术

该系列全系原生支持100万Token超长上下文窗口，核心优化了传统大模型长文本遗忘、上下文冗余、后期逻辑错乱的问题。通过动态上下文压缩与重点信息锚定机制，模型可在近千轮连续工具调用、数十小时长流程任务中，精准留存核心任务目标、前期操作逻辑与关键数据，不会因上下文过长出现信息丢失、逻辑断层。区别于多数模型单纯扩充Token上限的做法，MiMo V2.5通过权重动态刷新机制，过滤无效冗余信息，保留核心有效信息，兼顾长文本容量与推理速度。

（2）高利用率Token精简推理机制

这是该版本最核心的落地创新，主打低消耗、高性能的推理优化。模型重构了Token编码与推理逻辑，剔除无效Token输出、精简冗余语义表达，在同等任务精度下，相比Kimi K2.6节省42%Token消耗，相比Muse Spark节省50%Token消耗。简单来说，完成一模一样的复杂任务，MiMo V2.5所需的计算资源、调用Token数量大幅减少，直接降低开发者与企业的商用成本，解决了高端Agent模型算力消耗过高的行业痛点。

（3）长程任务自主诊断与纠错架构

针对复杂工程、代码开发、多步骤智能体任务容易出现局部错误、中途崩盘的问题，V2.5系列新增自主工作纠错机制。模型在千轮级工具调用、长周期任务执行中，可实时自检每一步操作的合理性，自动诊断代码漏洞、逻辑偏差、操作失误，无需人工干预即可完成回退、重构、修正并继续推进任务。官方测试中，该模型可自主完成数千行代码项目开发、完整编译器搭建，全程自主纠错、迭代优化，大幅提升复杂生产力任务的落地成功率。

（4）轻量化MoE混合专家架构优化

旗舰版V2.5-Pro采用3090亿总参数MoE架构，优化了前代专家激活逻辑，实现大参数底座、小激活消耗。模型日常推理仅激活约150亿核心参数，既保留了千亿级模型的高阶推理、复杂决策能力，又规避了大参数模型推理慢、算力成本高的问题，推理成本仅为国际主流旗舰闭源模型的2.5%，实现性能与成本的极致平衡。

四、表现评估

4.1 历史与现状

MiMo V2.5发布之初，凭借极致的Agent长任务能力与超高Token效率，迅速跻身全球开源大模型第一梯队，在Artificial Analysis、GDPVal-AA、Claw-Eval等权威榜单中位列开源模型全球第一，综合智能指数冲入全球大模型总榜前五，是当时唯一可对标国际顶尖闭源模型的国产开源模型。截至目前，该版本依旧是小米最强开源主力模型，在国产Agent赛道、长文本复杂任务赛道保持核心竞争力，虽后续行业新品持续迭代，但V2.5的Token效率、低成本商用优势仍未被全面超越，是中小开发者商用落地的优选模型。

4.2 优势亮点

结合业内主流权威评测榜单与实测数据，MiMo V2.5系列核心优势集中在Agent任务、代码工程、长文本推理、成本控制四大维度，优势具象且落地性强。

（1）Agent长程任务能力行业顶尖

在Claw-Eval、SWE-Bench Pro等专业智能体、代码评测基准中表现优异，V2.5-Pro在SWE-Bench Pro取得57.2分，无限接近Claude Opus 4.6的57.3分。可稳定完成千轮级连续工具调用、数十小时长周期自主任务，从零搭建完整编译器、Web应用等复杂工程任务，自主纠错、流程管控能力远超多数国产开源模型。

（2）代码工程能力大幅跃升

依托MiMo Coding Bench专项评测，V2.5-Pro得分73.7分，大幅超越前代V2-Pro，缩小与国际顶尖模型的差距。不仅支持基础代码生成、纠错、调试，还具备完整工程项目开发、架构设计、全流程落地能力，可独立完成数千行完整代码项目，适配专业开发场景。

（3）Token效率与成本优势碾压同级

这是该模型最核心的差异化优势，在同等任务效果下，相比国内外主流开源、闭源模型实现超40%的Token消耗节省，搭配小米低价计费方案与免费Token激励，大幅降低AI开发、批量调用、终端部署的成本，商用性价比行业领先。

（4）软硬件适配度极高

开源首日即完成阿里平头哥、昆仑芯、AMD等国内外主流算力芯片适配，兼容SGLang、vLLM等主流推理框架，支持全场景快速部署，无论是云端商用、终端轻量化落地还是本地私有化部署，都具备极强的兼容性。

4.3 缺点与不足

客观来看，MiMo V2.5系列存在明显短板，并非全能型模型，缺陷集中在基础数理、小众场景适配、极限多模态精度层面。

（1）高阶数理推理能力偏弱

相较于顶尖闭源模型，该模型在高等数学推导、复杂数理证明、硬核逻辑推理竞赛题型上表现一般，专项数理评测分数低于GPT、Claude同代旗舰，更适配应用型任务而非科研级数理研究场景。

（2）小众多模态场景精度不足

虽然支持全模态交互，但在高精度图像细节解析、专业音频降噪识别、复杂视频帧逻辑拆解等小众垂直多模态场景，精度略低于专注多模态的专项模型，存在细节识别偏差、语义解读不精准的问题。

（3）极限超高并发稳定性一般

在企业级十万级超高并发批量调用场景下，偶尔出现推理延迟波动、少量请求响应偏差的问题，相较于百度文心、阿里通义等深耕商用稳定性的模型，大规模云端部署的容错能力仍有提升空间。

五、重大事件

1. 36天极速迭代，刷新国产大模型更新速度

2026年3月小米发布MiMo V2系列后，仅间隔36天就推出V2.5全系列迭代版本，以“一月一更”的高频迭代速度刷新国产头部大模型更新纪录，凸显小米AI赛道的技术迭代效率与资源投入力度，引发行业对大模型迭代节奏的热议。

2. 开源登顶全球榜单，跻身国际第一梯队

MiMo V2.5-Pro发布后，在Artificial Analysis、GDPVal-AA、Claw-Eval多项权威榜单中位列全球开源大模型第一，综合实力进入全球所有大模型总榜前五，成为2026年上半年国产开源大模型的标杆产品，打破国际顶尖模型的性能垄断。

3. 宽松MIT开源+百万亿Token激励，引爆开发者生态

2026年4月28日，小米开源V2.5核心版本，采用无商用限制的MIT宽松协议，同步启动Orbit百万亿Token激励计划，免费开放海量算力资源。超低的商用门槛吸引全球大量开发者二创、适配与落地，快速构建起庞大的MiMo开源生态。

4. 实战对标国际旗舰，验证国产Agent硬核实力

官方公开多项极限实测案例，V2.5-Pro可自主完成编译器开发、完整Web视频编辑器搭建等高难度工程任务，效率远超人工，性能无限接近Claude Opus 4.6、GPT-5.4等国际闭源旗舰模型，让国产开源Agent模型的实战能力得到行业广泛认可。

5. 全栈软硬件适配，推动国产AI算力生态协同

V2.5系列实现全系国产推理芯片、主流开源推理框架的首日适配，打通模型、算力、部署全链路，有效推动国产AI软硬件协同迭代，成为国产算力生态适配最完善的开源大模型之一。

六、局限与妥协

MiMo V2.5为纯国产合规大模型，无海外使用壁垒、IP限制、海外支付门槛等问题，国内用户、开发者、企业可无障碍免费体验、开源部署与商用落地，因此本部分内容省略。

Question 2

MiMo V2.5的API价格是多少？

Accepted Answer

MiMo V2.5的API价格信息暂未收录，请访问星盘大模型百科获取最新数据。

Question 3

MiMo V2.5支持哪些功能？

Accepted Answer

支持深度思考模式，上下文窗口长度为1000000

Question 4

MiMo V2.5是国产模型吗？

Accepted Answer

是的，MiMo V2.5是由xiaomi开发的国产AI大模型，可直接访问使用。

MiMo V2.5

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

# 六、局限与妥协

📊
能力雷达星图

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

⚡ 体验反馈与渠道测速

⚔️
性能对标产品

Hy3 preview(high)

Qwen3.6-27B(Thinking)

MiMo V2.5 Pro Base

MiMo V2.5 Base

社区真实评价