Name: MiniMax M2.5
Rating: 9999 (1 reviews)
Author: MiniMax

Question 1

MiniMax M2.5是什么？

Accepted Answer

一、简介与定位

MiniMax M2.5是中国MiniMax公司于2026年2月13日发布的轻量化高性能旗舰级文本大模型，核心定位是兼顾极致性价比与旗舰级能力，聚焦Agent场景与编程需求，适配大规模商业化落地。

其名称中“M”是MiniMax文本大模型系列的核心标识，“2.5”代表其处于M2系列的迭代升级版本，是在M2、M2.1基础上的能力跃迁，而非全新基座模型；核心功能涵盖高阶编程、原生Agent能力、多语言处理及轻量化部署支持，能高效适配智能客服、实时翻译、代码开发等场景。官方使用门槛方面，提供商业化API服务，输入端定价约$0.30/百万tokens、输出端定价约$1.2–2.4/百万tokens，无明确免费额度，需通过官方平台订阅或购买token套餐使用，无明显地域使用限制；同期发布的“兄弟模型”包括聚焦多角色沉浸扮演的M2-her，以及升级后的Music 2.5+、Hailuo 2.3等多模态模型。

目前MiniMax M2.5仍处于生命周期中的主力阶段，尚未被淘汰，是MiniMax文本大模型阵营的核心产品之一；其最突出的核心特点是“小而精”，以仅10B的激活参数，实现媲美高阶旗舰模型的性能，同时将推理成本压缩至同类产品的1%，成为成本敏感型场景的首选模型。

二、发展历程

2.1 研发背景

MiniMax M2.5发布前，全球大模型行业已进入“决赛圈”，主流模型呈现两大阵营：海外阵营以OpenAI的GPT系列、Anthropic的Claude Opus 4.6、Google的Gemini 3 Pro为代表，优势在于能力全面、生态成熟，但存在定价高昂、推理成本高的痛点；国内阵营则有Kimi K2.5、GLM-5、DeepSeek V3.2等模型，在中文处理、本地化适配方面有优势，但部分模型在编程能力、Agent场景适配性上仍有差距。彼时行业正面临“算力成本居高不下”“Agent规模化落地受成本制约”“小参数模型性能难以突破”三大痛点，同时全模态融合成为发展趋势，MiniMax M2.5正是在这样的行业局势下诞生，聚焦“高性能+低成本”的差异化赛道，填补轻量化旗舰模型的市场空白。

2.2 关键节点

MiniMax自2022年初成立以来，便坚持全模态自研路线，2025年10月27日发布M2模型，凭借极致性价比迅速跻身OpenRouter全球调用量前三，成为首个日Token消耗量超50亿的中国模型，为M2.5的研发奠定了坚实基础。随后MiniMax进入快速迭代期，短短两个多月内完成M2.1版本的优化，重点提升编程与Agent基础能力；2026年1月，M2.5进入内部内测阶段，邀请企业开发者与技术团队参与测试，重点优化推理速度与成本控制，收集到大量Agent场景的实际反馈；2026年2月13日，MiniMax正式对外发布M2.5模型，同步公布其技术细节与商业化定价，上线当日便获得OpenClaw等第三方开源工具创始人的官方推荐；截至2026年3月，M2.5在OpenRouter平台的全场景市占率已超过20%，编程场景市占率一度突破50%。

2.3 家族构成

MiniMax M2.5隶属于MiniMax全模态模型家族，该家族涵盖文本、音频、图像、视频、音乐五大方向，核心成员包括：

M2系列：文本大模型核心阵营，也是M2.5的前身系列。其中M2发布于2025年10月，是开源MoE架构模型，主打高性价比与高吞吐量，登顶HuggingFace全球热榜；M2.1是M2的小幅优化版，重点提升Agentic能力，适配基础工具调用场景；M2.5则是该系列的旗舰升级款，在编程、Agent场景实现能力跃迁，同时进一步压缩成本。

M2-her：文本类细分模型，定位多角色沉浸扮演，专注长轮次复杂对话场景，与M2.5同期发布，互补覆盖不同文本需求。

Hailuo系列：视频生成模型，核心成员为Hailuo 2.3，主打原生1080P高清视频生成，在物理表现与指令遵循能力上表现突出，与M2.5共同构成MiniMax多模态生态的核心。

Speech系列：语音生成模型，以Speech 2.6为核心，具备超低时延优势，覆盖200多个国家和地区，适配Agent语音交互场景，与M2.5形成跨模态协同。

Music系列：音乐生成模型，代表为Music 2.5+，可生成5分钟完整专业级音乐，突破风格边界，补齐多模态创作的最后一块拼图。

三、核心技术剖析

3.1 固有技术

MiniMax M2.5继承了上一代M2模型的核心底层技术，基础架构采用Sparse MoE架构（稀疏混合专家架构），这种架构不同于传统的稠密架构，通过“激活部分专家”的方式，在保证模型性能的同时，大幅降低推理算力消耗，这也是其能实现“小参数、高性能”的核心基础之一。同时，它延续了MiniMax自研的CISPO算法，该算法从M1模型开始应用，核心优势是实现“好、快、省”的平衡，既能保证模型推理效果，又能提升响应速度、压缩token消耗。此外，它还继承了上一代模型的常规对齐手段，通过大规模真实场景数据微调，提升指令遵循能力与输出准确性，避免出现明显的偏离问题。

3.2 创新技术

MiniMax M2.5的核心创新的在于“Agent原生优化”与“效率提升”，重点解决Agent场景落地的成本与性能痛点，具体创新点如下：

1. 原生Agent RL架构：M2.5在设计之初就针对Agent任务进行深度优化，并非“聊天模型外挂工具”，而是采用MiniMax自研的Agent-Native强化学习框架Forge。该框架通过解耦训练引擎与Agent，实现对任意Agent脚手架和工具的泛化优化，简单来说，就是能适配各类Agent场景，无论是智能客服、代码开发还是复杂任务拆解，都能快速适配，无需额外进行大量二次开发。

2. 大规模Agent强化学习（RL Scaling）：这是M2.5能力跃迁的核心原因，通过Forge框架的异步调度与树状合并策略，实现约40倍的训练加速，让模型能快速学习海量Agent场景的任务逻辑。同时引入过程奖励机制，将“任务真实耗时”纳入奖励函数，不仅关注任务完成效果，还注重响应速度，彻底解决了传统模型在Agent长链路任务中“耗时久、效率低”的问题。

3. 推理成本极致优化：在Sparse MoE架构基础上，进一步优化模型对复杂任务的拆解能力，压缩思考过程中的token消耗，相比M2.1版本，推理速度提升37%，同时将Agent运行成本压缩至行业极低水平——每秒100Token的输出速度下，连续运行1小时仅需1美元，远低于Claude Opus 4.6和Gemini 3 Pro的成本。

4. 编程能力专项优化：针对编程场景进行定向微调，引入大量真实生产级代码数据，提升模型对复杂编程任务的拆解与实现能力，能像架构师一样思考编程项目，在One shot、长任务代码开发、代码修改等场景中表现突出，同时支持多语言编程，适配不同开发需求。

四、表现评估

4.1 历史与现状

刚发布时（2026年2月），MiniMax M2.5凭借“高性能+低成本”的差异化优势，迅速在全球开发者群体中出圈，发布两周内便登顶OpenRouter平台全球Token使用量榜首，成为当时最受关注的国产大模型之一，打破了海外巨头对高端大模型市场的垄断，同时填补了国内轻量化旗舰模型的空白。截至2026年4月，M2.5仍保持强劲的市场竞争力，位列OpenRouter平台全球使用量前五，与Kimi K2.5、GLM-5、DeepSeek V3.2一起，占据全球Top 5总调用量的85.7%，彰显了中国开源模型的全球竞争力；其商业化落地场景持续拓展，已广泛应用于智能客服、代码开发、Agent自动化等领域，成为企业级开发者的首选模型之一。不过随着MiniMax计划在2026年上半年推出M3系列模型，M2.5未来将逐步过渡为“性价比主力款”，聚焦中低端企业与个人开发者需求。

4.2 优势亮点

结合业内权威评测数据与实际使用反馈，MiniMax M2.5的优势主要集中在以下三个维度，表现处于行业第一梯队：

1. 编程能力突出：在公认高难度的编程基准测试SWE-Bench Verified中，M2.5获得80.2%的高分，略高于Anthropic的Claude Opus 4.6，在多语言任务Multi-SWE-Bench方面刷新SOTA（当前最优）；实际测试中，能快速完成前端设计、后端开发等复杂编程任务，生成速度是Claude Opus的3倍，5分钟即可完成同类模型20-30分钟的工作量，得到OpenClaw等开源工具创始人的官方推荐。

2. 性价比全球领先：在性能媲美高端旗舰模型的前提下，定价远低于同类产品，输入端定价仅为Claude Opus 4.6的1/7–1/17，输出端定价为其1/6–1/20；1万美元预算可支撑4个M2.5 Agent连续运行约一年，而Claude Opus 4.6仅能支撑约93天，这种成本优势让Agent大规模落地成为可能，尤其适合成本敏感型企业与开发者。

3. Agent场景适配性强：凭借原生Agent RL架构与Forge框架，在多步骤、长链路的复杂Agent任务中表现优异，具备强大的工具调用泛化能力与任务规划能力；同时支持100 TPS的高吞吐量，响应速度快，原生适配实时交互场景，无论是智能客服、自动化办公还是复杂任务拆解，都能稳定输出。

4.3 缺点与不足

客观来看，MiniMax M2.5仍存在一些明显短板，主要集中在以下方面，未达到“全场景顶尖”水平：

1. 逻辑推理存在短板：实测中，在部分生活化场景的逻辑判断上表现不佳，例如在“洗车”“丁真”等相关问题的回答中出现翻车，对复杂场景的因果关系判断不够精准，相比Gemini 3 Pro等海外高端模型，逻辑推理能力仍有提升空间。

2. 多模态融合能力薄弱：作为文本类模型，M2.5仅专注于文本、编程与Agent场景，不具备图像、视频、语音等多模态处理能力，无法实现跨模态协同任务，与MiniMax自身的Hailuo、Speech等模型的协同性不足，难以适配多模态融合的复杂场景。

3. 长文本处理存在局限：虽然在Agent长链路任务中表现优异，但在超长篇文本（如百万字文档）的理解与总结上，仍会出现信息丢失、重点偏差的问题，长上下文遗忘现象相比Kimi K2.5等专注长文本的模型更为明显。

五、重大事件

1. 2026年2月13日，MiniMax正式发布M2.5模型，同步公布其技术细节与商业化定价，新华网等权威媒体同步报道，其“每小时1美元的Agent运行成本”成为行业热点，引发开发者群体广泛讨论，发布当日OpenRouter平台调用量激增。

2. 2026年2月下旬，M2.5发布仅两周，便登顶OpenRouter平台全球Token使用量榜首，成为首个达成该成就的国产轻量化模型，同时在编程场景市占率突破50%，印证了其在开发者群体中的认可度。

3. 2026年3月，M2.5入选“2026全球开源大模型TOP10”，被评为“轻量化高性能标杆”，与其他三款国产模型一起占据全球Top 5总调用量的85.7%，彰显了中国开源大模型的全球竞争力。

4. 2026年3月，MiniMax发布2025年财报，财报中重点提及M2.5的商业化贡献，其低成本优势推动公司毛利率翻倍，从12.2%提升至25.4%，成为公司收入增长的核心驱动力之一，也让行业重新关注“模型效率”的重要性。

Question 2

MiniMax M2.5的API价格是多少？

Accepted Answer

MiniMax M2.5的API价格信息暂未收录，请访问星盘大模型百科获取最新数据。

Question 3

MiniMax M2.5支持哪些功能？

Accepted Answer

MiniMax M2.5的功能特性信息暂未收录。

Question 4

MiniMax M2.5是国产模型吗？

Accepted Answer

是的，MiniMax M2.5是由MiniMax开发的国产AI大模型，可直接访问使用。

MiniMax M2.5

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

📊
能力雷达星图

数据采集中

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

⚡ 体验反馈与渠道测速

⚔️
性能对标产品

Hy3 preview(high)

Qwen3.6-27B(Thinking)

MiMo V2.5 Pro Base

MiMo V2.5 Base

社区真实评价