Name: MiMo V2 Pro
Rating: 47 (1 reviews)
Author: Xiaomi

Question 1

MiMo V2 Pro是什么？

Accepted Answer

一、简介与定位

中国小米集团于2026年3月19日凌晨，正式发布了面向Agent时代的旗舰基座大模型MiMo V2 Pro，是小米AI战略布局中聚焦现实世界高强度Agent场景的核心产品。

其名称中“MiMo”是小米自研大模型系列的统一命名，后缀“Pro”代表“专业旗舰版”，区别于系列内其他定位更轻量化或专项化的模型；核心功能围绕Agent场景优化，具备强大的多步推理、工具调用能力，支持1M超长上下文处理，可适配编程、办公、智能设备操控等多类场景。官方使用门槛方面，该模型已开放API服务，采用按使用量分段计价模式，无强制订阅要求，上线初期曾联合多个Agent开发框架提供为期一周的限时免费体验，无明显使用权限限制；同期发布的“兄弟模型”包括全模态基座模型MiMo V2 Omni和语音合成模型MiMo V2 TTS，三者共同构成小米Agent时代的完整技术底座。

目前MiMo V2 Pro处于生命周期的最新主力阶段，尚未有迭代版本发布，其最突出的核心特点是“高性价比的旗舰级Agent能力”，以远低于同类顶尖模型的API定价，提供接近国际一流水平的复杂任务执行与长文本处理能力。

二、发展历程

2.1 研发背景

MiMo V2 Pro发布前，全球大模型行业已进入Agent时代，主流模型呈现两大趋势：一是OpenAI、Anthropic等海外厂商推出的Claude Opus 4.6、GPT 5.2等模型，具备强大的Agent交互与推理能力，但API定价高昂，普通开发者与企业难以负担；二是国内百度文心一言4.0、阿里通义千问3.0等模型，在中文场景适配性上有优势，但在超长上下文处理与复杂Agent工作流编排上仍有差距。同时，行业普遍面临“长文本处理显存占用过高”“Agent能力与成本难以平衡”的痛点。在此背景下，小米依托自身“人车家全生态”的场景优势，加大AI研发投入，推出MiMo V2 Pro，核心目标是打破海外模型的定价壁垒，打造适配真实应用场景、高性价比的旗舰Agent基座模型。

2.2 关键节点

小米在AI领域的布局由来已久，为MiMo系列模型的研发奠定了坚实基础，2025年小米便开始聚焦Agent场景的大模型研发，启动MiMo V2系列项目立项，重点攻克超长上下文处理与Agent工具调用优化两大核心难题。2026年3月初，小米将MiMo V2 Pro的早期测试版本以“Hunter Alpha”为匿名代号，上线全球最大API聚合平台OpenRouter，进行公开内测，期间调用量持续攀升，多次登顶日榜，验证了模型的实用性与市场认可度。经过半个多月的内测优化，2026年3月19日凌晨，小米正式官宣发布MiMo V2 Pro，同步推出系列另外两款模型，完成Agent时代的技术布局；发布后不久，该模型便接入WPS灵犀、小米浏览器等多个应用场景，进一步扩大落地范围。

2.3 家族构成

MiMo V2 Pro隶属于小米MiMo大模型家族，该家族目前以V2系列为核心，涵盖三款定位差异化的模型，形成完整的能力矩阵：

MiMo V2 Pro：家族旗舰基座模型，定位为“面向Agent时代的高强度任务执行者”，总参数量超1T，支持1M超长上下文，主打高性价比的Agent推理、工具调用与代码工程能力，是家族的核心主力模型，适配多类复杂应用场景。

MiMo V2 Omni：全模态基座模型，专注于多模态交互与理解，覆盖音频、图像、视频等多种输入形式，在音频理解上超越Gemini 3 Pro，图像理解能力逼近国际顶尖水平，定位为“多模态Agent的核心支撑”。

MiMo V2 TTS：语音合成专项模型，基于自研Audio Tokenizer架构，支持多方言、多风格语音生成，还能实现高质量歌声合成，定位为“智能体的语音交互入口”，为Agent场景提供自然、有温度的语音输出能力。

三、核心技术剖析

3.1 固有技术

MiMo V2 Pro继承了小米上一代MiMo V2-Flash模型的核心底层架构，采用混合专家（MoE）架构，通过多专家分工协作，在保证模型性能的同时，优化算力损耗；同时沿用了常规的SFT（有监督微调）与RL（强化学习）对齐手段，确保模型输出符合人类需求与使用场景。此外，其底层推理引擎延续了小米自研的优化框架，为后续的注意力机制创新与生态集成奠定了基础。

3.2 创新技术

该模型的核心创新集中在架构优化与场景适配上，重点解决了长文本处理与Agent能力落地的核心痛点，具体如下：

1. 7:1混合注意力架构（Hybrid Attention）：这是MiMo V2 Pro最核心的技术创新，打破了传统超长上下文模型显存占用过高的瓶颈。简单来说，模型将注意力机制分为两部分，7/8的网络层采用滑动窗口注意力，仅缓存最近4K Tokens的计算状态，将长文本计算压力降为线性级别，大幅降低显存占用；1/8的聚合层采用全局注意力，保留对1M长度内所有文本的全局视野，确保关键信息不丢失，实现“长文本处理+低显存占用”的双重目标，这也是其能以高性价比提供超长上下文能力的核心原因。

2. Agent场景专项微调：针对现实世界高强度Agent场景，进行了针对性的SFT与RL微调，优化了复杂工作流编排、长周期任务规划与精准工具调用能力。不同于通用大模型的泛化性微调，该模型重点适配OpenClaw、Claude Code等主流Agent框架，能够在无人工干预的情况下，完成端到端的复杂任务，比如一键生成功能完备的网页，或完成多步骤的办公文档处理。

3. 生态级推理引擎集成：底层推理引擎与金山WebOffice生态实现框架级集成，原生支持Word、Excel、PPT、PDF四大主流文档格式，无需额外适配，就能直接对接办公场景的Agent需求；同时与小米“人车家全生态”深度联动，为手机、汽车、智能家居等硬件设备的Agent应用提供了高效的推理支持，实现从“对话能力”到“系统级执行能力”的跨越。

四、表现评估

4.1 历史与现状

MiMo V2 Pro刚发布时，便凭借其1T参数量、1M超长上下文以及亲民的定价，迅速引发行业关注，在全球权威排行榜Artificial Analysis上位列全球第八、国内第二，瞬间跻身国内顶尖大模型行列；匿名内测期间，在OpenRouter平台登顶日榜、周榜，单日调用量达到第二名的两倍以上，展现出极强的市场认可度。截至2026年4月初，该模型上线仅半个月，月累计token消耗量已超过6万亿，成功登顶OpenRouter月榜，成为全球首个在日榜、周榜、月榜均排名第一的AI模型，行业地位进一步巩固，同时已广泛接入办公、搜索、智能设备等多个场景，落地进度持续加快。

4.2 优势亮点

结合业内权威排行榜与实际使用测评，MiMo V2 Pro的优势主要集中在三个核心维度，表现突出：

1. Agent能力顶尖：在OpenClaw标准评测榜单PinchBench、ClawEval上表现处于全球顶尖水平，任务完成率位居全球第三，能够无缝适配各类Agent框架，在复杂工作流编排、工具调用方面，与Claude Sonnet 4.6、GPT 5.2等国际顶尖模型处于同一梯队，内部工程师评测显示，其整体体感已逼近Claude Opus 4.6。

2. 长文本处理能力出众：支持1M超长上下文（约等于100万token），借助混合注意力架构，能够从容处理超长文档的完整理解与推理，无明显的长文本遗忘问题，同时显存占用比同类模型降低80%以上，在长音频理解、超长文档编辑等场景中优势显著。

3. 高性价比突出：API定价仅为Claude Opus 4.6的1/5，其中256K上下文以内，每百万输入Token仅需1美元，每百万输出Token3美元，1M上下文以内则分别为2美元和6美元，大幅降低了开发者与企业使用顶尖Agent模型的成本，这也是其能够快速抢占市场的核心优势之一。

此外，该模型在代码工程领域表现优异，具备出色的系统设计、任务规划能力与优雅的代码风格，体感接近国际顶尖水平；同时在中文场景适配性上表现良好，能够精准理解中文语境与复杂需求，适配国内各类应用场景。

4.3 缺点与不足

尽管MiMo V2 Pro表现出色，但仍存在一些客观短板，符合其产品定位与发展阶段的特点：

1. 多模态能力缺失：作为纯文本基座模型，其不具备图像、音频、视频等多模态理解与生成能力，无法适配需要多模态交互的Agent场景，需搭配同系列的MiMo V2 Omni模型才能实现全模态功能，单独使用时场景局限性较明显。

2. 部分复杂推理能力有待提升：在超高难度的数学推理、逻辑论证场景中，表现略逊于GPT 5.2、Claude Opus 4.6等顶尖模型，偶尔会出现推理步骤不严谨、计算错误的情况，更适合常规复杂任务，而非极致难度的推理场景。

3. 落地场景仍需拓展：虽然已接入办公、搜索、手机等核心场景，但在工业、医疗、教育等专业领域的落地较少，场景适配性仍集中在通用领域，专业场景的定制化能力不足，生态完善度还有提升空间。

五、重大事件

1. 匿名内测引爆行业关注（2026年3月初）：小米将MiMo V2 Pro的早期版本以“Hunter Alpha”为代号，匿名上线OpenRouter平台，上线后调用量持续飙升，多次登顶日榜，单日调用量远超第二名，引发全球开发者猜测与讨论，为后续正式发布积累了大量关注度。

2. 深夜三连发，完善Agent技术矩阵（2026年3月19日）：小米选择凌晨悄然发布MiMo V2 Pro、MiMo V2 Omni、MiMo V2 TTS三款模型，避开常规发布会高峰，既制造了话题热度，也完成了Agent时代的完整技术布局，“小米深夜发布三款大模型”的消息当天刷屏科技圈。

3. 登顶OpenRouter三项榜单，创行业纪录（2026年3月-4月）：发布后半个月内，MiMo V2 Pro先后登顶OpenRouter日榜、周榜、月榜，成为全球首个在这三个维度均排名第一的AI模型，月累计token消耗量突破6万亿，充分印证了其市场认可度与实用性。

4. 深度联动金山办公，落地办公场景（2026年3月下旬）：MiMo V2 Pro的MiMo Claw模块全面打通金山WebOffice生态，原生支持四大主流文档格式，WPS灵犀正式接入该模型，实现办公场景的Agent能力落地，让普通用户也能借助模型提升办公效率。

Question 2

MiMo V2 Pro的API价格是多少？

Accepted Answer

MiMo V2 Pro的API输入价格为7.2500元/百万Token，输出价格为21.7500元/百万Token。

Question 3

MiMo V2 Pro支持哪些功能？

Accepted Answer

MiMo V2 Pro的功能特性信息暂未收录。

Question 4

MiMo V2 Pro是国产模型吗？

Accepted Answer

是的，MiMo V2 Pro是由Xiaomi开发的国产AI大模型，可直接访问使用。

MiMo V2 Pro

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

📊
能力雷达星图

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API

平台：OpenRouter 模型：MiMo-V2-Pro

⚡ 体验反馈与渠道测速

🤝 第三方测速反馈

⚔️
性能对标产品

Doubao-Seed-2.0-lite-260428(high)

Qwen3.7-Max(Thinking)

Claude Opus 4.7 (high)

Gemini 3.5 Flash (high)

社区真实评价