Minimax M2

Minimax M2

minimax-m2

机构/公司
MiniMax(国内 🇨🇳)
发布日期
未披露
版本状态
⭐ 当前主力
开源状态
🌍 开源可见
能力模态
💬 大语言模型
上下文长度
未知
参数规模:暂未收录
主要语言:暂未收录
底层架构:暂未收录
开源协议:暂未收录
官方计费模式:参见下方【使用模块】

📖
词条百科 Wiki

# 一、简介与定位

中国上海稀宇科技(MiniMax)于2025年10月27日发布了一款开源旗舰级大模型——Minimax M2,核心定位为专为AI智能体和编程场景打造,兼顾性能、成本与速度的轻量级高效模型。

Minimax M2的名称中,“M”是MiniMax公司大模型家族的核心系列标识,无特殊后缀,代表该系列的第二代主力开源型号;其核心功能聚焦智能体效率提升,擅长编程开发、复杂工具调用和长周期任务规划,同时具备较强的通用智能。使用门槛方面,该模型已开源并采用MIT协议,用户可在Hugging Face等平台获取完整权重,MiniMax Agent平台提供限时免费体验,API服务定价远低于同类模型,无强制订阅要求,仅在免费期结束后需按Token量付费;同期无直接兄弟模型发布,其后续迭代版本M2.1于2025年11月快速推出,属于同系列的性能强化版。

目前Minimax M2仍处于活跃生命周期,未被淘汰,是MiniMax开源生态的核心基础模型,其最突出的核心特点是采用“大总量+小激活”的MoE架构,以极低的成本实现了接近海外顶尖模型的编程与智能体性能。

# 二、发展历程

# 2.1 研发背景

Minimax M2发布前,行业内主流大模型呈现“两极分化”格局:海外以GPT-4、Claude 3.5 Sonnet为代表的模型性能强劲,但API成本高昂、响应延迟较高;国内则有DeepSeek-V3.2、GLM-4等模型发力开源与性能,但在智能体工具调用、端到端编程场景的综合表现仍有差距。同时,AI智能体成为行业发展风口,但传统大模型普遍存在“性能与效率不可兼得”的痛点——要么参数庞大、成本居高不下,要么轻量化设计导致能力不足。在此背景下,MiniMax瞄准“旗舰能力+平民成本”的市场空白,研发推出了Minimax M2,聚焦智能体与编程场景的实际生产力需求。

# 2.2 关键节点

MiniMax自2021年底成立以来,始终聚焦全模态大模型研发,在语音、视频领域积累了深厚技术基础后,于2025年上半年正式启动文本大模型M系列的迭代研发,核心目标是突破智能体与编程场景的性能瓶颈。2025年6月,MiniMax发布M1模型,首款开源MoE架构模型,为M2的研发奠定了稀疏架构基础;同年8-9月,M2进入内部测试阶段,重点优化编程能力与工具调用稳定性,期间邀请数百名开发者参与测试,收集反馈并调整模型参数;2025年10月27日,MiniMax正式发布并开源Minimax M2,同步在MiniMax Agent平台上线,开放限时免费体验;发布后仅一个月,该模型就在全球模型聚合平台OpenRouter实现日耗Token超500亿,成为首个达成该成就的中国模型。

# 2.3 家族构成

Minimax M2隶属于MiniMax公司的M系列文本大模型家族,该系列主打“小步快跑、聚焦生产力”的迭代路线,各模型定位清晰、分工明确,具体如下:

Minimax M1:2025年6月发布,是家族首款开源MoE模型,总参数规模未公开,核心定位为“推理深度优先”,奠定了M系列稀疏架构的技术基础,主要用于验证MoE架构在通用推理场景的可行性,目前已逐步被后续迭代模型替代。

Minimax M2:2025年10月发布,家族第二代主力开源模型,总参数2300亿、激活参数100亿,定位为“智能体与编程专用模型”,兼顾性能、成本与速度,是目前家族中应用最广泛的开源型号,也是生态建设的核心基础。

Minimax M2.1:2025年11月发布,M2的性能强化版,核心优化方向为复杂任务执行与编程能力,被硅谷编程工具Kilo Code设为默认模型,定位为“专业编程场景专用模型”,填补了M2在高阶编程任务中的细微短板。

Minimax M2.5:2026年2月发布,家族迭代升级的集大成者,定位为“旗舰级原生Agent模型”,对标Claude Opus、GPT-4o,在编程、智能体工具调用等领域实现性能跃迁,是目前家族的顶级型号,但未完全替代M2的开源基础定位。

Minimax M2.7:2026年3月发布,家族首款自进化模型,定位为“自主迭代型模型”,能够深度参与自身优化迭代,进一步完善了家族在高阶智能体场景的布局,与M2形成“基础开源+高阶进化”的互补格局。

# 三、核心技术剖析

# 3.1 固有技术

Minimax M2继承了上一代M1模型的核心技术底座,采用标准的Transformer架构作为基础,保障了模型的通用推理能力与语言理解能力。同时,延续了M1的MoE(混合专家)稀疏架构设计,核心逻辑是将模型参数拆分为多个细分领域的“专家模块”,避免全量参数激活,这一设计为M2实现“高性能+低成本”奠定了基础。此外,该模型还继承了MiniMax家族常规的对齐手段,通过大规模真实场景数据微调,确保模型输出的准确性与实用性,减少无意义输出和幻觉问题。

# 3.2 创新技术

Minimax M2的核心创新点集中在架构优化与推理模式升级,聚焦解决智能体场景的核心痛点,具体如下:

1.  优化型MoE架构:采用“2300亿总参数+100亿激活参数”的精巧设计,打破了传统大模型“性能与效率不可兼得”的困境。简单来说,总参数规模保证了模型的知识广度与推理深度,相当于为模型储备了庞大的“知识库”;而仅激活100亿参数,相当于只调用“专科医生”处理对应任务,无需全量参数“全员上阵”,既降低了算力成本,又将推理速度提升至每秒100Token,是Claude 3.5 Sonnet的近两倍。

2.  交错式思考(Interleaved Thinking):这是M2专为智能体场景设计的创新推理模式,区别于传统模型的线性思维链(CoT)。传统模型会预先制定完整计划,再执行工具调用,一旦中间步骤出现偏差,就会导致整个任务失败;而交错式思考构建了“规划→执行→反思”的动态循环,模型每执行一步工具调用,都会根据返回结果实时调整下一步计划,能够即时自我修正错误,避免长任务中的“状态漂移”,同时有效解决了长文本、长周期任务中的记忆丢失问题。

3.  原生Agent工具适配:M2在训练阶段就融入了大量智能体工具交互数据,支持Shell、浏览器、Python代码解释器等多种工具的协同调用,无需额外复杂适配,就能直接用于构建复杂智能体工作流。这种原生适配能力,让模型在跨工具协作、多步骤任务规划中表现突出,能够持续定位任务漏洞、从不稳定步骤中恢复,大幅提升智能体的落地实用性。

# 四、表现评估

# 4.1 历史与现状

Minimax M2刚发布时,凭借开源策略、极致的性价比和出色的智能体表现,迅速在行业内脱颖而出:发布当日即登顶Hugging Face全球热榜,在第三方机构Artificial Analysis的测试中斩获开源模型第一名、全球总排名第五,成为中国首个跻身该榜单全球前五的开源大模型;同时,在OpenRouter平台快速成为国内模型Token用量第一,编程场景Token用量全球第三,引发全球开发者关注。截至2026年4月,M2仍保持较高的活跃度,虽已被后续的M2.5、M2.7迭代,但作为开源基础模型,其生态适配性强,仍是中小开发者、企业构建智能体与编程工具的优选,并未被市场淘汰,反而成为MiniMax开源生态的核心支撑。

# 4.2 优势亮点

结合业内权威评测数据与实际应用反馈,Minimax M2的优势主要集中在三个核心维度,表现突出:

1.  编程能力优异:在Terminal-Bench、Multi-SWE-Bench等编程相关评测中,M2的表现超越Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等顶尖模型,尤其擅长多文件编辑、编码-运行-修复循环以及测试验证修复,在SWE-Bench Verified测试中,启用交错式思考后得分提升超3%,具备接近架构师级别的编程能力。

2.  智能体性能突出:在BrowseComp等智能体相关评测中,M2的得分实现40%的大幅增长,能够规划并执行跨Shell、浏览器、检索和代码运行器的复杂、长周期工具链,保持证据的可追溯性,在复杂智能体任务中的规划性与稳定性,不逊于海外顶尖模型。

3.  性价比全球领先:根据Artificial Analysis的评测数据,M2的综合性能接近Claude 3.5 Sonnet,但API价格仅为其8%,输入Token定价0.3美元/百万,输出Token定价1.2美元/百万;同时,100亿激活参数的设计,让其部署成本大幅降低,适配中小团队与个人开发者的使用需求,打破了“顶尖性能必高成本”的行业困境。

# 4.3 缺点与不足

客观来看,Minimax M2仍存在一些明显短板,主要集中在以下方面:

1.  通用场景表现一般:该模型侧重智能体与编程场景优化,在通用语言生成、情感分析、多模态交互等场景的表现,不如同级别通用型大模型,例如文本创作的流畅度、情感表达的细腻度,均有一定提升空间。

2.  长文本处理有局限:虽然采用了交错式思考解决部分记忆问题,但在处理超长篇文本(如万字以上文档总结、多轮跨主题对话)时,仍会出现细节丢失、逻辑衔接不畅的问题,长程依赖处理能力相较于M2.5等后续迭代模型有明显差距。

3.  技术路线存在争议:MiniMax研发团队在测试中发现,滑动窗口注意力(SWA)会导致模型性能损失,因此最终采用全注意力机制,这与部分论文中“线性注意力更适合长序列任务”的结论不符,也引发了业内关于注意力机制选择的讨论,同时也说明其在长序列优化上仍有探索空间。

4.  开源生态不完善:相较于DeepSeek、GLM等成熟开源模型,M2的开源社区二创较少,官方提供的适配工具、教程相对有限,对于技术能力较弱的开发者,部署和优化难度较高。

# 五、重大事件

1.  2025年10月27日,Minimax M2正式发布并开源,当日登顶Hugging Face全球热榜,同时在Artificial Analysis评测中斩获开源模型第一名,成为中国首个跻身该榜单全球前五的开源大模型,标志着国产开源大模型在智能体领域实现突破。

2.  2025年11月,Minimax M2在OpenRouter平台实现日耗Token超500亿,成为首个达成该成就的中国模型,编程场景Token用量跻身全球第三,证明其在开发者群体中的认可度,商业化潜力初步显现。

2025年12月,亚马逊AWS re:Invent 2025大会上,亚马逊宣布旗下Amazon Bedrock云服务引入Minimax M2,成为该平台接入的核心国产模型之一,标志着M2的技术实力获得国际云厂商认可,开启国际化布局。

4.  2025年底,Minimax M2的“交错式思考”技术在海外AI研究社区引发广泛讨论,其对智能体推理模式的创新,被多个研究机构引用,同时也引发了关于“线性思维链与动态循环推理”的行业辩论,推动了智能体技术的发展。

5.  2026年初,开发者利用Minimax M2在MiniMax Agent平台复刻多款经典网页游戏,其中一款在线五子棋游戏实现了对战、聊天、用户注册等完整功能,引发开源社区关注,成为M2实际应用落地的典型案例,展现了其在编程与智能体场景的实用性。

由本站联合社区极客共同编撰,最后更新:2026-05-04 02:26:14
开放 Wiki 模式开启中

📊
能力雷达星图

权威基准

数据采集中

该模型太新啦!百科已抢先收录基础档案,权威雷达图评测数据正在快马加鞭测试中。

模型家族构成

🔗 相关链接

词条待补全

没有找到体验地址?去反馈!

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API
API价格
实时更新
平台:OpenRouter 模型:MiniMax M2
输入(/1M)1.85
输出(/1M)7.25
价格由固定汇率换算而来,可能存在细微差距。
API价格
实时更新
平台:Siliconflow 模型:[已下架] MiniMax-M2
输入(/1M)2.10
输出(/1M)8.40
价格由固定汇率换算而来,可能存在细微差距。

体验反馈与渠道测速

🤝 第三方测速反馈
🔌
平台:Siliconflow
模型:[已下架] MiniMax-M2
状态:暂无反馈0 票
前往直达
🔌
平台:OpenRouter
模型:MiniMax M2
状态:暂无反馈0 票
前往直达

⚔️
性能对标产品

AI

Hy3 preview(high)

Unknown
Qwen3.6-27B(Thinking)

Qwen3.6-27B(Thinking)

Qwen
MiMo V2.5 Pro Base

MiMo V2.5 Pro Base

Xiaomi
MiMo V2.5 Base

MiMo V2.5 Base

Xiaomi
💬

社区真实评价

🤐

登录后才能发表评价,与极客们一起交流哦~

正在拉取评论数据...