Name: MiniMax M2
Rating: 191 (1 reviews)
Author: MiniMax

Question 1

MiniMax M2是什么？

Accepted Answer

一、简介与定位

中国上海稀宇科技（MiniMax）于2025年10月27日发布了一款开源旗舰级大模型——Minimax M2，核心定位为专为AI智能体和编程场景打造，兼顾性能、成本与速度的轻量级高效模型。

Minimax M2的名称中，“M”是MiniMax公司大模型家族的核心系列标识，无特殊后缀，代表该系列的第二代主力开源型号；其核心功能聚焦智能体效率提升，擅长编程开发、复杂工具调用和长周期任务规划，同时具备较强的通用智能。使用门槛方面，该模型已开源并采用MIT协议，用户可在Hugging Face等平台获取完整权重，MiniMax Agent平台提供限时免费体验，API服务定价远低于同类模型，无强制订阅要求，仅在免费期结束后需按Token量付费；同期无直接兄弟模型发布，其后续迭代版本M2.1于2025年11月快速推出，属于同系列的性能强化版。

目前Minimax M2仍处于活跃生命周期，未被淘汰，是MiniMax开源生态的核心基础模型，其最突出的核心特点是采用“大总量+小激活”的MoE架构，以极低的成本实现了接近海外顶尖模型的编程与智能体性能。

二、发展历程

2.1 研发背景

Minimax M2发布前，行业内主流大模型呈现“两极分化”格局：海外以GPT-4、Claude 3.5 Sonnet为代表的模型性能强劲，但API成本高昂、响应延迟较高；国内则有DeepSeek-V3.2、GLM-4等模型发力开源与性能，但在智能体工具调用、端到端编程场景的综合表现仍有差距。同时，AI智能体成为行业发展风口，但传统大模型普遍存在“性能与效率不可兼得”的痛点——要么参数庞大、成本居高不下，要么轻量化设计导致能力不足。在此背景下，MiniMax瞄准“旗舰能力+平民成本”的市场空白，研发推出了Minimax M2，聚焦智能体与编程场景的实际生产力需求。

2.2 关键节点

MiniMax自2021年底成立以来，始终聚焦全模态大模型研发，在语音、视频领域积累了深厚技术基础后，于2025年上半年正式启动文本大模型M系列的迭代研发，核心目标是突破智能体与编程场景的性能瓶颈。2025年6月，MiniMax发布M1模型，首款开源MoE架构模型，为M2的研发奠定了稀疏架构基础；同年8-9月，M2进入内部测试阶段，重点优化编程能力与工具调用稳定性，期间邀请数百名开发者参与测试，收集反馈并调整模型参数；2025年10月27日，MiniMax正式发布并开源Minimax M2，同步在MiniMax Agent平台上线，开放限时免费体验；发布后仅一个月，该模型就在全球模型聚合平台OpenRouter实现日耗Token超500亿，成为首个达成该成就的中国模型。

2.3 家族构成

Minimax M2隶属于MiniMax公司的M系列文本大模型家族，该系列主打“小步快跑、聚焦生产力”的迭代路线，各模型定位清晰、分工明确，具体如下：

Minimax M1：2025年6月发布，是家族首款开源MoE模型，总参数规模未公开，核心定位为“推理深度优先”，奠定了M系列稀疏架构的技术基础，主要用于验证MoE架构在通用推理场景的可行性，目前已逐步被后续迭代模型替代。

Minimax M2：2025年10月发布，家族第二代主力开源模型，总参数2300亿、激活参数100亿，定位为“智能体与编程专用模型”，兼顾性能、成本与速度，是目前家族中应用最广泛的开源型号，也是生态建设的核心基础。

Minimax M2.1：2025年11月发布，M2的性能强化版，核心优化方向为复杂任务执行与编程能力，被硅谷编程工具Kilo Code设为默认模型，定位为“专业编程场景专用模型”，填补了M2在高阶编程任务中的细微短板。

Minimax M2.5：2026年2月发布，家族迭代升级的集大成者，定位为“旗舰级原生Agent模型”，对标Claude Opus、GPT-4o，在编程、智能体工具调用等领域实现性能跃迁，是目前家族的顶级型号，但未完全替代M2的开源基础定位。

Minimax M2.7：2026年3月发布，家族首款自进化模型，定位为“自主迭代型模型”，能够深度参与自身优化迭代，进一步完善了家族在高阶智能体场景的布局，与M2形成“基础开源+高阶进化”的互补格局。

三、核心技术剖析

3.1 固有技术

Minimax M2继承了上一代M1模型的核心技术底座，采用标准的Transformer架构作为基础，保障了模型的通用推理能力与语言理解能力。同时，延续了M1的MoE（混合专家）稀疏架构设计，核心逻辑是将模型参数拆分为多个细分领域的“专家模块”，避免全量参数激活，这一设计为M2实现“高性能+低成本”奠定了基础。此外，该模型还继承了MiniMax家族常规的对齐手段，通过大规模真实场景数据微调，确保模型输出的准确性与实用性，减少无意义输出和幻觉问题。

3.2 创新技术

Minimax M2的核心创新点集中在架构优化与推理模式升级，聚焦解决智能体场景的核心痛点，具体如下：

1. 优化型MoE架构：采用“2300亿总参数+100亿激活参数”的精巧设计，打破了传统大模型“性能与效率不可兼得”的困境。简单来说，总参数规模保证了模型的知识广度与推理深度，相当于为模型储备了庞大的“知识库”；而仅激活100亿参数，相当于只调用“专科医生”处理对应任务，无需全量参数“全员上阵”，既降低了算力成本，又将推理速度提升至每秒100Token，是Claude 3.5 Sonnet的近两倍。

2. 交错式思考（Interleaved Thinking）：这是M2专为智能体场景设计的创新推理模式，区别于传统模型的线性思维链（CoT）。传统模型会预先制定完整计划，再执行工具调用，一旦中间步骤出现偏差，就会导致整个任务失败；而交错式思考构建了“规划→执行→反思”的动态循环，模型每执行一步工具调用，都会根据返回结果实时调整下一步计划，能够即时自我修正错误，避免长任务中的“状态漂移”，同时有效解决了长文本、长周期任务中的记忆丢失问题。

3. 原生Agent工具适配：M2在训练阶段就融入了大量智能体工具交互数据，支持Shell、浏览器、Python代码解释器等多种工具的协同调用，无需额外复杂适配，就能直接用于构建复杂智能体工作流。这种原生适配能力，让模型在跨工具协作、多步骤任务规划中表现突出，能够持续定位任务漏洞、从不稳定步骤中恢复，大幅提升智能体的落地实用性。

四、表现评估

4.1 历史与现状

Minimax M2刚发布时，凭借开源策略、极致的性价比和出色的智能体表现，迅速在行业内脱颖而出：发布当日即登顶Hugging Face全球热榜，在第三方机构Artificial Analysis的测试中斩获开源模型第一名、全球总排名第五，成为中国首个跻身该榜单全球前五的开源大模型；同时，在OpenRouter平台快速成为国内模型Token用量第一，编程场景Token用量全球第三，引发全球开发者关注。截至2026年4月，M2仍保持较高的活跃度，虽已被后续的M2.5、M2.7迭代，但作为开源基础模型，其生态适配性强，仍是中小开发者、企业构建智能体与编程工具的优选，并未被市场淘汰，反而成为MiniMax开源生态的核心支撑。

4.2 优势亮点

结合业内权威评测数据与实际应用反馈，Minimax M2的优势主要集中在三个核心维度，表现突出：

1. 编程能力优异：在Terminal-Bench、Multi-SWE-Bench等编程相关评测中，M2的表现超越Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等顶尖模型，尤其擅长多文件编辑、编码-运行-修复循环以及测试验证修复，在SWE-Bench Verified测试中，启用交错式思考后得分提升超3%，具备接近架构师级别的编程能力。

2. 智能体性能突出：在BrowseComp等智能体相关评测中，M2的得分实现40%的大幅增长，能够规划并执行跨Shell、浏览器、检索和代码运行器的复杂、长周期工具链，保持证据的可追溯性，在复杂智能体任务中的规划性与稳定性，不逊于海外顶尖模型。

3. 性价比全球领先：根据Artificial Analysis的评测数据，M2的综合性能接近Claude 3.5 Sonnet，但API价格仅为其8%，输入Token定价0.3美元/百万，输出Token定价1.2美元/百万；同时，100亿激活参数的设计，让其部署成本大幅降低，适配中小团队与个人开发者的使用需求，打破了“顶尖性能必高成本”的行业困境。

4.3 缺点与不足

客观来看，Minimax M2仍存在一些明显短板，主要集中在以下方面：

1. 通用场景表现一般：该模型侧重智能体与编程场景优化，在通用语言生成、情感分析、多模态交互等场景的表现，不如同级别通用型大模型，例如文本创作的流畅度、情感表达的细腻度，均有一定提升空间。

2. 长文本处理有局限：虽然采用了交错式思考解决部分记忆问题，但在处理超长篇文本（如万字以上文档总结、多轮跨主题对话）时，仍会出现细节丢失、逻辑衔接不畅的问题，长程依赖处理能力相较于M2.5等后续迭代模型有明显差距。

3. 技术路线存在争议：MiniMax研发团队在测试中发现，滑动窗口注意力（SWA）会导致模型性能损失，因此最终采用全注意力机制，这与部分论文中“线性注意力更适合长序列任务”的结论不符，也引发了业内关于注意力机制选择的讨论，同时也说明其在长序列优化上仍有探索空间。

4. 开源生态不完善：相较于DeepSeek、GLM等成熟开源模型，M2的开源社区二创较少，官方提供的适配工具、教程相对有限，对于技术能力较弱的开发者，部署和优化难度较高。

五、重大事件

1. 2025年10月27日，Minimax M2正式发布并开源，当日登顶Hugging Face全球热榜，同时在Artificial Analysis评测中斩获开源模型第一名，成为中国首个跻身该榜单全球前五的开源大模型，标志着国产开源大模型在智能体领域实现突破。

2. 2025年11月，Minimax M2在OpenRouter平台实现日耗Token超500亿，成为首个达成该成就的中国模型，编程场景Token用量跻身全球第三，证明其在开发者群体中的认可度，商业化潜力初步显现。

2025年12月，亚马逊AWS re:Invent 2025大会上，亚马逊宣布旗下Amazon Bedrock云服务引入Minimax M2，成为该平台接入的核心国产模型之一，标志着M2的技术实力获得国际云厂商认可，开启国际化布局。

4. 2025年底，Minimax M2的“交错式思考”技术在海外AI研究社区引发广泛讨论，其对智能体推理模式的创新，被多个研究机构引用，同时也引发了关于“线性思维链与动态循环推理”的行业辩论，推动了智能体技术的发展。

5. 2026年初，开发者利用Minimax M2在MiniMax Agent平台复刻多款经典网页游戏，其中一款在线五子棋游戏实现了对战、聊天、用户注册等完整功能，引发开源社区关注，成为M2实际应用落地的典型案例，展现了其在编程与智能体场景的实用性。

Question 2

MiniMax M2的API价格是多少？

Accepted Answer

MiniMax M2的API输入价格为1.8488元/百万Token，输出价格为7.2500元/百万Token。

Question 3

MiniMax M2支持哪些功能？

Accepted Answer

上下文窗口长度为205000

Question 4

MiniMax M2是国产模型吗？

Accepted Answer

是的，MiniMax M2是由MiniMax开发的国产AI大模型，可直接访问使用。

MiniMax M2

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

能力雷达星图

模型家族构成

相关链接

🌟
星盘总结

✅
核心优势

❌
局限与短板

🎯 适用场景推荐

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API

平台：OpenRouter 模型：MiniMax M2

平台：SiliconFlow 🚫[已下架] 模型：MiniMax-M2

⚡ 体验反馈与渠道测速

🏛️ 官方渠道体验

🤝 第三方测速反馈

⚔️
性能对标产品

Qwen3.6-27B(thinking)

Nemotron 3 Ultra

Llama 2 70b SteerLM Chat

Qwen3 TTS

社区真实评价