Name: Kimi K2 Thinking
Rating: 9999 (1 reviews)
Author: Moonshot

Question 1

Kimi K2 Thinking是什么？

Accepted Answer

一、简介与定位

中国北京月之暗面科技有限公司（Moonshot AI）于2025年11月6日，正式发布了旗下开源旗舰级大模型Kimi K2 Thinking，定位为具备原生自主思考与工具调用能力的智能体模型。

其名称中“K2”源自乔戈里峰的别称，象征着模型对技术高峰的攀登，“Thinking”则直接点明其核心特质——强化的自主思考能力，区别于基础版模型；核心功能聚焦于自主任务拆解、多轮工具调用与复杂推理，可完成从需求分析到结果验证的全流程闭环操作。官方使用门槛友好，模型及权重文件开源至Hugging Face，支持用户在自有服务器部署，API服务全面上线，无免费额度，计费标准为每百万输入tokens 4元、每百万输出tokens 16元，兼容OpenAI和Anthropic两种API格式；同期发布的“兄弟模型”为Kimi K2的基础版与指令微调版，即Kimi-K2-Base和Kimi-K2-Instruc，分别适配科研微调与通用任务场景。

目前Kimi K2 Thinking处于生命周期中的活跃主力阶段，尚未被迭代淘汰，是月之暗面开源生态中的核心模型之一；其最突出的核心特点是原生集成“思考-工具-再思考”动态循环机制，无需人工干预即可实现高效的复杂Agent任务处理。

二、发展历程

2.1 研发背景

Kimi K2 Thinking发布前，行业内主流大模型呈现“闭源领跑、开源追赶”的格局，海外有OpenAI的GPT-4系列、Anthropic的Claude 3系列，主打闭源高性能，在Agent能力与长文本处理上表现突出，但使用成本高昂且不开源；国内则有DeepSeek R1、字节跳动豆包等，其中DeepSeek R1因复刻OpenAI o1的深度思考能力并开源而爆火，豆包则凭借字节生态优势在中文处理与多模态领域发力。当时行业的核心痛点的是，多数开源模型缺乏原生Agent能力，需依赖人类拆解任务，工具调用稳定性不足，且大参数模型训练易出现不稳定、Token利用效率低等问题；同时，AI行业正从“Chat时代”向“Agent时代”转型，市场对具备自主思考与工具调用能力的开源模型需求迫切，Kimi K2 Thinking正是在这样的行业局势下诞生，聚焦开源领域的Agent能力突破，填补国产开源模型在该领域的短板。

2.2 关键节点

2025年初，受DeepSeek R1爆火与行业Agent转型趋势影响，月之暗面调整战略，停止大规模市场投流，回归技术研发，启动Kimi K2系列模型的立项工作，核心目标是打造具备顶尖Agent能力的开源大模型，解决当时开源模型工具调用与推理深度不足的问题。同年7月11日，月之暗面率先发布Kimi K2基础模型，同步开源Kimi-K2-Base与Kimi-K2-Instruc两个版本，凭借万亿参数规模与优秀的代码、Agent能力引发行业关注，为Kimi K2 Thinking的研发奠定了坚实的技术基础。经过近4个月的迭代优化，聚焦“自主思考”能力的升级，2025年11月6日，月之暗面正式推出并开源Kimi K2 Thinking，进一步强化模型的推理深度与工具调用闭环能力；11月18日，该模型被AI搜索应用Perplexity接入，成为其唯一接入的国产模型，标志着其国际认可度的提升。2026年以来，Kimi K2 Thinking持续迭代，与Kimi K2.5模型形成协同，完善开源生态布局。

2.3 家族构成

Kimi K2 Thinking隶属于月之暗面Kimi大模型家族，该家族以开源为核心特色，聚焦通用人工智能与Agent能力，各模型定位清晰、分工明确，具体如下：

Kimi Chat：家族早期核心产品，定位为通用智能助手，具备较强的多语言能力与长文本处理能力，支持约20万汉字上下文，主打长文总结、联网搜索、代码编写等基础功能，是月之暗面积累用户与技术经验的核心载体，2024年曾凭借高下载量跻身国内头部AI助手行列。

Kimi k0-math：2024年11月发布的专项模型，定位为数学推理专用模型，能力可对标OpenAI o1-mini和o1-preview，在中考、高考、考研及竞赛类数学基准测试中表现优异，填补了家族在数学专项领域的空白。

Kimi k1.5：2025年1月发布的多模态思考模型，具备SOTA级别多模态推理与通用推理能力，在短思考模式下，数学、代码等能力大幅超越GPT-4o等模型，为后续Kimi K2系列的推理能力优化提供了技术借鉴。

Kimi K2-Base：2025年7月与Kimi K2系列同步发布，定位为基础预训练模型，未经过指令微调，主要面向科研人员与开发者，适用于自定义微调、技术研究等场景，是整个Kimi K2系列的技术基座。

Kimi K2-Instruc：同期发布的通用指令微调版本，定位为通用任务型模型，无需复杂调试即可应对多数日常问答与基础Agent任务，兼顾易用性与性能，是面向普通开发者的核心开源版本。

Kimi K2 Thinking：2025年11月发布，定位为旗舰级开源思考模型，是Kimi K2系列的能力升级版本，主打原生自主思考与多轮工具调用能力，面向需要处理复杂Agent任务的开发者与企业用户，是家族中Agent能力最强的开源模型。

Kimi K2.5：2026年1月发布，定位为多模态旗舰模型，基于原生多模态架构设计，支持视觉与文本输入，集成视觉理解、编程、Agent等多种能力，是家族向多模态领域延伸的核心产品，与Kimi K2 Thinking形成功能互补。

三、核心技术剖析

3.1 固有技术

Kimi K2 Thinking继承了Kimi K2基座模型的核心底层技术，确保了基础性能的稳定性。其一，采用MoE（混合专家模型）架构，总参数达1万亿，激活参数320亿，这种架构的核心优势的是可灵活调度不同领域的“专家模块”，在提升模型知识覆盖范围的同时，降低推理算力成本，兼顾性能与效率；其二，继承了Kimi K2的Muon优化器基础，该优化器性能显著优于传统的AdamW优化器，能提升Token利用效率，为大规模训练提供基础支撑；其三，延续了标准的Transformer注意力机制，并优化了长文本处理能力，支持最长128K上下文，可高效处理长文本推理与数据处理任务；其四，采用常规的指令对齐手段，确保模型输出符合人类需求，降低幻觉概率，同时兼容主流Agent/Coding框架，提升易用性。

3.2 创新技术

Kimi K2 Thinking的核心竞争力在于其针对“自主思考”与“Agent能力”的技术创新，重点解决了传统开源模型推理深度不足、工具调用不闭环的痛点，具体创新点如下：

1. 原生“思考-工具-再思考”动态循环机制：这是该模型最核心的创新，无需人工干预，即可完成从需求分析、子任务拆解、工具调用到结果验证的全流程闭环。简单来说，模型会先“思考”用户需求的核心的是什么，拆解成可执行的小任务，再调用对应的工具完成任务，最后对结果进行验证和优化，支持高达300轮的连续工具调用，就像人类研究员一样“刨根问底”，大幅提升复杂Agent任务的处理效率。

2. Test-Time Scaling（测试时扩展）技术：专门解决复杂场景下推理深度不足的问题，通过同步扩展思考Token长度与工具调用轮次，让模型在处理复杂任务（如多步骤代码编写、大规模数据分析）时，能保持清晰的逻辑链条，减少推理断层，提升任务完成的准确性。

3. INT4量化感知训练（QAT）方案：在不损失核心性能的前提下，对模型进行量化优化，将推理速度提升约2倍。这一创新降低了模型的硬件部署门槛，不仅适配高端GPU，对国产加速芯片及中低端硬件也更友好，让普通开发者也能在自有服务器上部署使用。

4. 选择性QK-Clip权重裁剪机制：继承并优化了Kimi K2的Muon优化器，针对大规模训练中易出现的注意力logits爆炸（导致训练不稳定）问题，采用per-head QK-Clip策略，仅对出现logits异常的注意力头进行权重裁剪，最小化对模型训练的干扰，确保15.5T token训练全程无loss spike，提升训练稳定性与Token利用效率。

5. 通用强化学习与自我评价机制：不仅在代码、数学等可验证任务上应用强化学习，还引入自我评价机制（self-judging），解决了不可验证任务（如风格化写作、创意规划）的奖励稀缺问题，通过持续优化critic模块，提升模型在泛化任务中的表现。

四、表现评估

4.1 历史与现状

刚发布时（2025年11月），Kimi K2 Thinking凭借原生Agent能力与开源特性，迅速跻身国内开源大模型第一梯队，成为当时最受关注的国产开源模型之一，发布后不久便被Perplexity接入，获得国际行业人士的认可，《自然》杂志也对其所属的K2系列给予高度评价，称其开启了“另一个DeepSeek时刻”。截至2026年4月，该模型仍处于活跃迭代状态，未被淘汰，是月之暗面开源生态的核心支撑，虽然随着Kimi K2.5多模态模型的发布，其部分关注度被分流，但在纯文本Agent任务与代码领域，依旧保持着国产开源模型的顶尖水平，广泛应用于开发者调试、企业Agent部署等场景，开源社区的二创与适配工作也持续推进。

4.2 优势亮点

结合业内权威基准测试数据与实际应用表现，Kimi K2 Thinking的优势主要集中在Agent能力、代码能力、推理能力三大维度，具体如下：

1. Agent能力突出：在Tau2-bench、AceBench等Agent任务基准测试中成绩领先，其“思考-工具-再思考”机制可稳定解析复杂指令，将需求自动拆解为格式规范的ToolCall结构，能无缝接入owl、Cline、RooCode等Agent/Coding框架。实际应用中，可完成13万行原始数据的分析、生成专业统计图表及报告，也能制定详细的行程规划并发送邮件，工具调用的稳定性与闭环能力远超同期多数开源模型。

2. 代码能力顶尖：在SWE-bench Verified测试中，以72.5的成绩远超其他开源模型，在LiveCodeBench v6等编程基准测试中也表现优异。实际使用中，可生成具备设计感的复杂代码，支持粒子系统、3D场景等特效开发，甚至能One-shot生成完整的期货交易系统，自动选用TradingView搭建专业级界面，适配多种编程语言，满足开发者的各类编程需求。

3. 推理与长文本处理能力优异：在GPQA-Diamond等推理基准测试中表现突出，通用知识推理、规划等任务的能力显著提升；支持最长128K上下文，结合MoE架构优化，长文本处理效率高，无明显的长文本遗忘问题，可高效完成长文总结、大规模数据处理等任务。

4. 部署成本低且易用性强：采用INT4量化感知训练，推理速度快、硬件门槛低，vLLM、SGLang、ktransformers等推理引擎已同步支持，用户可在自有服务器部署，获得与官方API相同的体验；API兼容OpenAI和Anthropic格式，方便用户切换使用，计费价格相较于GPT-4、Claude 3等闭源模型更低，性价比突出。

4.3 缺点与不足

客观来看，Kimi K2 Thinking仍存在一些短板，主要集中在多模态能力、部分场景幻觉及细分领域适配性上，具体如下：

1. 无原生多模态能力：作为纯文本模型，Kimi K2 Thinking不支持图像、音频等多模态输入输出，无法处理视觉相关的Agent任务（如图像识别+工具调用），这一点相较于后续发布的Kimi K2.5及GPT-4o等多模态模型存在明显差距，限制了其在多场景的应用。

2. 特定场景存在幻觉：在处理冷门领域知识、复杂逻辑推理的极端场景时，仍会出现少量幻觉，主要表现为生成错误的工具调用指令、编造不存在的知识点，尤其是在未接入联网功能时，对最新信息的准确性把控不足。

3. 细分领域适配性不足：虽然通用Agent与代码能力突出，但在部分垂直领域（如医疗、法律）的专业度不足，缺乏针对性的微调优化，无法满足垂直行业的高精度Agent任务需求，需开发者自行进行二次微调。

4. 强化学习仍有提升空间：尽管引入了自我评价机制，但在不可验证任务（如创意写作、情感表达）中，输出质量的稳定性不足，有时会出现逻辑混乱、风格偏离的问题，相较于闭源模型仍有差距。

五、重大事件

1. 2025年11月6日，Kimi K2 Thinking正式发布并开源：月之暗面同步公布模型权重文件与技术细节，定位为“迄今能力最强”的开源思考模型，凭借原生Agent能力引发行业广泛关注，成为当时国产开源模型的焦点，进一步完善了Kimi K2系列的产品矩阵。

2. 2025年11月18日，被Perplexity接入成为唯一国产模型：AI搜索应用Perplexity正式接入Kimi K2 Thinking，这是该应用首次接入国产开源模型，标志着Kimi K2 Thinking的性能获得国际认可，也为国产模型走向海外奠定了基础。

2025年底，助力月之暗面完成5亿美金融资：凭借Kimi K2 Thinking及K2系列模型的优秀表现，月之暗面成功获得IDG及老股东加持的5亿美金融资，缓解了商业化压力，为模型后续迭代与开源生态建设提供了资金支持。

2026年3月，依托其技术积累发布Attention Residuals论文：月之暗面基于Kimi K2系列（含K2 Thinking）的技术实践，发布挑战传统神经网络残差连接机制的论文，被OpenAI联合创始人Andrej Karpathy高度评价，称其重新解读了“Attention is All You Need”，提升了Kimi系列模型的学术影响力。

2026年3月，成为英伟达GTC大会御用展示模型：Kimi系列模型（含K2 Thinking）在黄仁勋的GTC 2026主旨演讲中，被用于展示下一代芯片的推理性能，月之暗面成为唯一受邀的中国独立大模型公司，进一步提升了Kimi K2 Thinking的行业知名度。

Question 2

Kimi K2 Thinking的API价格是多少？

Accepted Answer

Kimi K2 Thinking的API输入价格为4.3500元/百万Token，输出价格为18.1250元/百万Token。

Question 3

Kimi K2 Thinking支持哪些功能？

Accepted Answer

Kimi K2 Thinking的功能特性信息暂未收录。

Question 4

Kimi K2 Thinking是国产模型吗？

Accepted Answer

是的，Kimi K2 Thinking是由Moonshot开发的国产AI大模型，可直接访问使用。

Kimi K2 Thinking

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

📊
能力雷达星图

数据采集中

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API

平台：OpenRouter 模型：Kimi K2 Thinking

⚡ 体验反馈与渠道测速

🤝 第三方测速反馈

⚔️
性能对标产品

Hy3 preview(high)

Qwen3.6-27B(Thinking)

MiMo V2.5 Pro Base

MiMo V2.5 Base

社区真实评价