MiMo V2 Pro

MiMo V2 Pro

mimo-v2-pro

机构/公司
Xiaomi(国内 🇨🇳)
发布日期
2026-03-30
版本状态
⭐ 当前主力
开源状态
🔒 闭源商业
能力模态
💬 大语言模型
上下文长度
未知
参数规模:暂未收录
主要语言:暂未收录
底层架构:暂未收录
开源协议:暂未收录
官方计费模式:参见下方【使用模块】

📖
词条百科 Wiki

# 一、简介与定位

中国小米集团于2026年3月19日凌晨,正式发布了面向Agent时代的旗舰基座大模型MiMo V2 Pro,是小米AI战略布局中聚焦现实世界高强度Agent场景的核心产品。

其名称中“MiMo”是小米自研大模型系列的统一命名,后缀“Pro”代表“专业旗舰版”,区别于系列内其他定位更轻量化或专项化的模型;核心功能围绕Agent场景优化,具备强大的多步推理、工具调用能力,支持1M超长上下文处理,可适配编程、办公、智能设备操控等多类场景。官方使用门槛方面,该模型已开放API服务,采用按使用量分段计价模式,无强制订阅要求,上线初期曾联合多个Agent开发框架提供为期一周的限时免费体验,无明显使用权限限制;同期发布的“兄弟模型”包括全模态基座模型MiMo V2 Omni和语音合成模型MiMo V2 TTS,三者共同构成小米Agent时代的完整技术底座。

目前MiMo V2 Pro处于生命周期的最新主力阶段,尚未有迭代版本发布,其最突出的核心特点是“高性价比的旗舰级Agent能力”,以远低于同类顶尖模型的API定价,提供接近国际一流水平的复杂任务执行与长文本处理能力。

# 二、发展历程

# 2.1 研发背景

MiMo V2 Pro发布前,全球大模型行业已进入Agent时代,主流模型呈现两大趋势:一是OpenAI、Anthropic等海外厂商推出的Claude Opus 4.6、GPT 5.2等模型,具备强大的Agent交互与推理能力,但API定价高昂,普通开发者与企业难以负担;二是国内百度文心一言4.0、阿里通义千问3.0等模型,在中文场景适配性上有优势,但在超长上下文处理与复杂Agent工作流编排上仍有差距。同时,行业普遍面临“长文本处理显存占用过高”“Agent能力与成本难以平衡”的痛点。在此背景下,小米依托自身“人车家全生态”的场景优势,加大AI研发投入,推出MiMo V2 Pro,核心目标是打破海外模型的定价壁垒,打造适配真实应用场景、高性价比的旗舰Agent基座模型。

# 2.2 关键节点

小米在AI领域的布局由来已久,为MiMo系列模型的研发奠定了坚实基础,2025年小米便开始聚焦Agent场景的大模型研发,启动MiMo V2系列项目立项,重点攻克超长上下文处理与Agent工具调用优化两大核心难题。2026年3月初,小米将MiMo V2 Pro的早期测试版本以“Hunter Alpha”为匿名代号,上线全球最大API聚合平台OpenRouter,进行公开内测,期间调用量持续攀升,多次登顶日榜,验证了模型的实用性与市场认可度。经过半个多月的内测优化,2026年3月19日凌晨,小米正式官宣发布MiMo V2 Pro,同步推出系列另外两款模型,完成Agent时代的技术布局;发布后不久,该模型便接入WPS灵犀、小米浏览器等多个应用场景,进一步扩大落地范围。

# 2.3 家族构成

MiMo V2 Pro隶属于小米MiMo大模型家族,该家族目前以V2系列为核心,涵盖三款定位差异化的模型,形成完整的能力矩阵:

MiMo V2 Pro:家族旗舰基座模型,定位为“面向Agent时代的高强度任务执行者”,总参数量超1T,支持1M超长上下文,主打高性价比的Agent推理、工具调用与代码工程能力,是家族的核心主力模型,适配多类复杂应用场景。

MiMo V2 Omni:全模态基座模型,专注于多模态交互与理解,覆盖音频、图像、视频等多种输入形式,在音频理解上超越Gemini 3 Pro,图像理解能力逼近国际顶尖水平,定位为“多模态Agent的核心支撑”。

MiMo V2 TTS:语音合成专项模型,基于自研Audio Tokenizer架构,支持多方言、多风格语音生成,还能实现高质量歌声合成,定位为“智能体的语音交互入口”,为Agent场景提供自然、有温度的语音输出能力。

# 三、核心技术剖析

# 3.1 固有技术

MiMo V2 Pro继承了小米上一代MiMo V2-Flash模型的核心底层架构,采用混合专家(MoE)架构,通过多专家分工协作,在保证模型性能的同时,优化算力损耗;同时沿用了常规的SFT(有监督微调)与RL(强化学习)对齐手段,确保模型输出符合人类需求与使用场景。此外,其底层推理引擎延续了小米自研的优化框架,为后续的注意力机制创新与生态集成奠定了基础。

# 3.2 创新技术

该模型的核心创新集中在架构优化与场景适配上,重点解决了长文本处理与Agent能力落地的核心痛点,具体如下:

1.  7:1混合注意力架构(Hybrid Attention):这是MiMo V2 Pro最核心的技术创新,打破了传统超长上下文模型显存占用过高的瓶颈。简单来说,模型将注意力机制分为两部分,7/8的网络层采用滑动窗口注意力,仅缓存最近4K Tokens的计算状态,将长文本计算压力降为线性级别,大幅降低显存占用;1/8的聚合层采用全局注意力,保留对1M长度内所有文本的全局视野,确保关键信息不丢失,实现“长文本处理+低显存占用”的双重目标,这也是其能以高性价比提供超长上下文能力的核心原因。

2.  Agent场景专项微调:针对现实世界高强度Agent场景,进行了针对性的SFT与RL微调,优化了复杂工作流编排、长周期任务规划与精准工具调用能力。不同于通用大模型的泛化性微调,该模型重点适配OpenClaw、Claude Code等主流Agent框架,能够在无人工干预的情况下,完成端到端的复杂任务,比如一键生成功能完备的网页,或完成多步骤的办公文档处理。

3.  生态级推理引擎集成:底层推理引擎与金山WebOffice生态实现框架级集成,原生支持Word、Excel、PPT、PDF四大主流文档格式,无需额外适配,就能直接对接办公场景的Agent需求;同时与小米“人车家全生态”深度联动,为手机、汽车、智能家居等硬件设备的Agent应用提供了高效的推理支持,实现从“对话能力”到“系统级执行能力”的跨越。

# 四、表现评估

# 4.1 历史与现状

MiMo V2 Pro刚发布时,便凭借其1T参数量、1M超长上下文以及亲民的定价,迅速引发行业关注,在全球权威排行榜Artificial Analysis上位列全球第八、国内第二,瞬间跻身国内顶尖大模型行列;匿名内测期间,在OpenRouter平台登顶日榜、周榜,单日调用量达到第二名的两倍以上,展现出极强的市场认可度。截至2026年4月初,该模型上线仅半个月,月累计token消耗量已超过6万亿,成功登顶OpenRouter月榜,成为全球首个在日榜、周榜、月榜均排名第一的AI模型,行业地位进一步巩固,同时已广泛接入办公、搜索、智能设备等多个场景,落地进度持续加快。

# 4.2 优势亮点

结合业内权威排行榜与实际使用测评,MiMo V2 Pro的优势主要集中在三个核心维度,表现突出:

1.  Agent能力顶尖:在OpenClaw标准评测榜单PinchBench、ClawEval上表现处于全球顶尖水平,任务完成率位居全球第三,能够无缝适配各类Agent框架,在复杂工作流编排、工具调用方面,与Claude Sonnet 4.6、GPT 5.2等国际顶尖模型处于同一梯队,内部工程师评测显示,其整体体感已逼近Claude Opus 4.6。

2.  长文本处理能力出众:支持1M超长上下文(约等于100万token),借助混合注意力架构,能够从容处理超长文档的完整理解与推理,无明显的长文本遗忘问题,同时显存占用比同类模型降低80%以上,在长音频理解、超长文档编辑等场景中优势显著。

3.  高性价比突出:API定价仅为Claude Opus 4.6的1/5,其中256K上下文以内,每百万输入Token仅需1美元,每百万输出Token3美元,1M上下文以内则分别为2美元和6美元,大幅降低了开发者与企业使用顶尖Agent模型的成本,这也是其能够快速抢占市场的核心优势之一。

此外,该模型在代码工程领域表现优异,具备出色的系统设计、任务规划能力与优雅的代码风格,体感接近国际顶尖水平;同时在中文场景适配性上表现良好,能够精准理解中文语境与复杂需求,适配国内各类应用场景。

# 4.3 缺点与不足

尽管MiMo V2 Pro表现出色,但仍存在一些客观短板,符合其产品定位与发展阶段的特点:

1.  多模态能力缺失:作为纯文本基座模型,其不具备图像、音频、视频等多模态理解与生成能力,无法适配需要多模态交互的Agent场景,需搭配同系列的MiMo V2 Omni模型才能实现全模态功能,单独使用时场景局限性较明显。

2.  部分复杂推理能力有待提升:在超高难度的数学推理、逻辑论证场景中,表现略逊于GPT 5.2、Claude Opus 4.6等顶尖模型,偶尔会出现推理步骤不严谨、计算错误的情况,更适合常规复杂任务,而非极致难度的推理场景。

3.  落地场景仍需拓展:虽然已接入办公、搜索、手机等核心场景,但在工业、医疗、教育等专业领域的落地较少,场景适配性仍集中在通用领域,专业场景的定制化能力不足,生态完善度还有提升空间。

# 五、重大事件

1.  匿名内测引爆行业关注(2026年3月初):小米将MiMo V2 Pro的早期版本以“Hunter Alpha”为代号,匿名上线OpenRouter平台,上线后调用量持续飙升,多次登顶日榜,单日调用量远超第二名,引发全球开发者猜测与讨论,为后续正式发布积累了大量关注度。

2.  深夜三连发,完善Agent技术矩阵(2026年3月19日):小米选择凌晨悄然发布MiMo V2 Pro、MiMo V2 Omni、MiMo V2 TTS三款模型,避开常规发布会高峰,既制造了话题热度,也完成了Agent时代的完整技术布局,“小米深夜发布三款大模型”的消息当天刷屏科技圈。

3.  登顶OpenRouter三项榜单,创行业纪录(2026年3月-4月):发布后半个月内,MiMo V2 Pro先后登顶OpenRouter日榜、周榜、月榜,成为全球首个在这三个维度均排名第一的AI模型,月累计token消耗量突破6万亿,充分印证了其市场认可度与实用性。

4.  深度联动金山办公,落地办公场景(2026年3月下旬):MiMo V2 Pro的MiMo Claw模块全面打通金山WebOffice生态,原生支持四大主流文档格式,WPS灵犀正式接入该模型,实现办公场景的Agent能力落地,让普通用户也能借助模型提升办公效率。

由本站联合社区极客共同编撰,最后更新:2026-05-14 03:34:01
开放 Wiki 模式开启中

📊
能力雷达星图

权威基准

模型家族构成

🔗 相关链接

词条待补全

没有找到体验地址?去反馈!

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API
API价格
实时更新
平台:OpenRouter 模型:MiMo-V2-Pro
输入(/1M)7.25
输出(/1M)21.75
价格由固定汇率换算而来,可能存在细微差距。

体验反馈与渠道测速

🤝 第三方测速反馈
🔌
平台:OpenRouter
模型:MiMo-V2-Pro
状态:暂无反馈0 票
前往直达

⚔️
性能对标产品

Doubao-Seed-2.0-lite-260428(high)

Doubao-Seed-2.0-lite-260428(high)

ByteDance
Qwen3.7-Max(Thinking)

Qwen3.7-Max(Thinking)

Qwen
Claude Opus 4.7 (high)

Claude Opus 4.7 (high)

Anthropic
Gemini 3.5 Flash (high)

Gemini 3.5 Flash (high)

Google
💬

社区真实评价

🤐

登录后才能发表评价,与极客们一起交流哦~

正在拉取评论数据...