Question 1

Longcat Flash Chat是什么？

Accepted Answer

Longcat Flash Chat 大模型深度百科

Name: Longcat Flash Chat
Rating: 110 (1 reviews)
Author: MeiTuan

一、简介与定位

中国美团旗下AI团队于2025年9月1日发布的一款开源型大模型，核心定位为高效推理的非思考型基础模型，主打计算效率与性能的双重优化，面向开发者和企业提供低成本、高速度的AI能力支持。

其名称中“Longcat”可理解为“龙猫”，是美团大模型家族的统一命名标识；“Flash”意为“极速”，直观体现其核心优势——超快推理速度。核心功能涵盖智能体任务处理、代码生成、逻辑推理、基础问答等，主打高效轻量化运行；官方使用门槛极低，完全开源，可在GitHub、Hugging Face平台免费下载使用，API无强制订阅要求，无明显使用限制，仅需具备基础的算力支持即可部署；同期未发布同系列兄弟模型，其后续升级版本LongCat-Flash-Omni于2025年11月推出，形成家族补充。

目前该模型处于生命周期中的活跃阶段，是美团大模型家族的核心基础款，未被淘汰且持续迭代优化；其最突出的核心特点是“高效低成本”，在560B大参数量基础上，仅激活少量参数就能实现比肩主流模型的性能，推理速度和使用成本均处于行业前列。

二、发展历程

2.1 研发背景

Longcat Flash Chat发布前，行业内主流大模型呈现“重性能、轻效率”的格局：海外有Claude 4、Gemini 2.5系列，主打强推理和多模态能力，但推理速度较慢、使用成本偏高；国内有DeepSeek-V3.1、Qwen3 MoE等，虽在中文处理和开源领域有优势，但部分模型存在算力消耗大、训练效率低的痛点。彼时，大模型行业正从“参数竞赛”转向“效率竞赛”，开发者和企业对“高性能、低成本、快响应”的开源模型需求日益迫切，美团基于自身AI战略布局，依托多年技术积累，推出了这款主打高效推理的开源大模型，填补了行业内“大参数量与高效率兼顾”的空白。

2.2 关键节点

美团的大模型研发可追溯至2023年，当年美团接手王慧文创立的“光年之外”团队，组建独立AI军团GN06，正式启动自研大模型立项，核心方向锁定“高效推理”，为Longcat系列模型的研发奠定了团队和技术基础。2024年，美团持续加大AI研发投入，全年研发投入达211亿元，同时完成了大模型底层架构的初步搭建，确定采用MoE混合专家架构，并开始小范围内测相关技术方案。2025年上半年，模型进入密集测试阶段，重点优化推理速度和算力控制，通过PID控制器等技术实现激活参数的动态调节；同年9月1日，美团正式对外发布Longcat Flash Chat，同步在GitHub、Hugging Face平台开源，并上线官方官网，标志着该模型正式进入公开应用阶段。2025年11月，基于该模型升级的全模态版本LongCat-Flash-Omni发布，进一步完善了家族产品矩阵。

2.3 家族构成

Longcat Flash Chat隶属于美团Longcat大模型家族，目前家族主要包含两个核心成员，定位各有侧重、相互补充，均为开源模型。

Longcat Flash Chat：家族基础款，发布于2025年9月，定位为非思考型基础模型，采用MoE混合专家架构，总参数560B，主打高效推理和低成本运行，核心优势集中在智能体任务、代码生成和逻辑推理，面向开发者提供轻量化、高性价比的基础AI能力，无需复杂算力即可部署使用。

LongCat-Flash-Omni：家族升级款，发布于2025年11月，定位为全模态大模型，以Longcat Flash Chat的高效架构为基础，新增图像、视频、语音等多模态处理能力，总参数5600亿，激活参数270亿，实现了全模态覆盖与高效推理的兼顾，主打实时音视频交互、跨模态理解等场景，填补了家族多模态能力的空白。

三、核心技术剖析

3.1 固有技术

Longcat Flash Chat继承了当前大模型主流的底层技术框架，核心是混合专家模型（Mixture-of-Experts, MoE）架构，这是目前大参数量模型实现“性能与效率平衡”的主流架构，其核心逻辑是将模型拆分为多个“专家模块”，根据输入内容的复杂度，动态调用部分专家进行计算，避免全量参数运算，从而降低算力消耗。同时，该模型继承了常规的模型对齐手段，通过多轮指令微调，确保模型输出符合人类预期，减少无关响应；此外，其采用了行业通用的超参数迁移和模型层叠加训练方式，借鉴了小模型的最优超参数配置，加速模型收敛，保证训练过程的稳定性，这也是当前大模型训练中普遍采用的成熟技术。

3.2 创新技术

该模型的核心竞争力在于架构和工程层面的创新，重点解决了传统MoE模型冗余计算、效率低下的痛点，具体创新点如下：

1. 零计算专家（Zero-Computation Experts）机制：这是其最核心的创新点。在传统MoE模型中，无论输入任务简单与否，都会调用部分专家模块进行计算，存在冗余算力消耗。而Longcat Flash Chat在专家池中嵌入“恒等映射通道”，相当于给简单任务开辟了“ETC通道”，路由器通过动态评分机制，结合PID控制器实时微调专家偏置，对重复指令、基础问答等简单任务，直接跳过计算层，数据原样返回；仅对复杂任务，激活标准专家进行深度推理。这种设计使40%的简单请求免于计算负担，激活参数可灵活调节在18.6B-31.3B之间，平均激活参数27B，大幅提升了吞吐效率，同时控制了算力消耗。

2. 跨层流水线技术（Cross-layer Pipelining）：针对传统MoE模型中“计算与通信无法并行”导致的延迟问题，该模型在层间铺设跨层通道，采用Shortcut-connected MoE结构，让上一层的FFN计算未结束时，下一层的参数通信已提前发起，实现计算与通信的无缝接力。这种优化使训练速度提升30%，20T token预训练仅需30天，集群可用率高达98.48%，同时显著降低了推理延迟。

3. 规模化训练优化策略：采用“超参数迁移+模型生长初始化”的组合策略，先用小模型预测最优超参数（如学习率、批大小），再将14层模型堆叠成28层checkpoint，避免模型冷启动带来的效率低下问题；同时引入确定性计算套件，确保大规模训练过程的稳定性，这也是其能在30天内完成高效训练的关键原因之一。

4. 智能体能力专项优化：自建Agentic评测集指导数据策略，在训练全流程中通过多智能体方法生成多样化高质量的轨迹数据，针对性强化模型的智能体任务处理能力，使其在复杂智能体应用中具备突出优势，这也是其区别于其他开源模型的重要特点。

四、表现评估

4.1 历史与现状

刚发布时，Longcat Flash Chat凭借“560B参数+高效推理+开源免费”的组合优势，迅速成为行业焦点，发布首日便登上GitHub热榜，Hugging Face下载量单周超5万，被业内称为“大模型黑马”。彼时其行业地位突出，在开源大模型中，性能比肩DeepSeek-V3.1、Qwen3 MoE等主流模型，且在推理速度和成本上具备明显优势，甚至在部分场景中追平闭源模型Claude 4 Sonnet。截至2026年4月，该模型仍处于活跃状态，虽随着LongCat-Flash-Omni的发布，其核心定位转向“基础高效推理”，但仍是开发者部署轻量化AI应用、企业降低AI成本的优选开源模型，行业认可度持续保持，开源社区的二创和优化仍在持续。

4.2 优势亮点

结合量子位、智东西等媒体实测数据及行业基准测试，Longcat Flash Chat的优势主要集中在三个核心维度，表现处于开源模型第一梯队：

1. 推理速度与成本优势显著：在H800显卡上，单用户推理速度可达100+ tokens/s，远超同参数规模的DeepSeek-V3.1、Kimi-K2等模型；同时输出成本低至5元/百万token（约0.7美元/百万token），大幅低于行业同级别模型，这一优势使其在耗时较长的复杂智能体应用中表现突出，也降低了开发者和企业的使用成本。

2. 智能体与逻辑推理能力优异：在Agent工具调用、指令遵循等场景中，表现超过DeepSeek-V3.1、Qwen3 MoE，甚至比肩闭源的Claude 4 Sonnet；在逻辑陷阱测试中，能精准识破题干漏洞，例如面对改编版“薛定谔死猫悖论”，可直接指出“题目已声明初始状态为死亡，辐射无法起死回生”，而同类部分模型仍陷入量子态分析的误区。

3. 代码生成能力突出：在TerminalBench等编程基准测试中，与Claude 4 Sonnet不相上下，能生成流畅可用的代码，例如小球氛围编程测试中，其生成的代码运行效果媲美专业开发，卡尔文循环矢量图代码结构严谨、注释清晰，可直接用于实际开发场景。

4.3 缺点与不足

客观来看，Longcat Flash Chat仍存在明显短板，主要集中在以下三个方面，均为实测中发现的真实问题：

1. 非思考型定位导致复杂推理能力不足：作为非思考型基础模型，其擅长快速响应和基础任务处理，但在需要深度思考的复杂场景中表现一般，例如复杂数学证明、多步骤逻辑推导等，虽能完成高考数学压轴题等难度的任务，但面对更高级别的数学研究、复杂科研推理时，准确性和完整性会明显下降。

2. 无原生多模态能力：该模型仅支持文本模态，无法处理图像、视频、语音等内容，若需实现多模态交互，需额外集成其他模态的编码器，使用门槛有所提升，这也使其在多模态应用场景中竞争力不足，最终被后续发布的LongCat-Flash-Omni弥补这一短板。

3. 开源社区支持仍有提升空间：相较于Qwen、Llama等成熟开源模型，Longcat Flash Chat的开源社区规模较小，开发者贡献的插件、优化方案相对较少，部分边缘场景的适配性不足，且官方后续的迭代更新频率，略低于行业主流开源模型。

五、重大事件

1. 2025年9月1日，正式发布并开源：美团首次曝光其“Building LLM”战略进展，发布Longcat Flash Chat，同步在GitHub、Hugging Face开源并上线官网，发布首日GitHub Star破万，引发技术圈广泛关注，被多家科技媒体称为“外卖巨头的AI逆袭”，打破了外界对美团“只做外卖”的刻板印象。

2. 2025年9月，实测成绩引发行业热议：量子位、人人都是产品经理等媒体发布实测报告，显示Longcat Flash Chat在推理速度、成本上刷新行业认知，且在部分基准测试中追平闭源模型，引发行业对“高效推理大模型”的讨论，推动行业从“参数竞赛”向“效率竞赛”进一步转型。

3. 2025年11月3日，家族升级款发布：美团发布LongCat-Flash-Omni，以Longcat Flash Chat的架构为基础，新增全模态能力，同步上线官方App，支持联网搜索和语音通话，进一步完善了Longcat家族产品矩阵，也让Longcat Flash Chat的“基础架构”价值得到进一步凸显。

4. 2025年下半年，开源社区持续升温：该模型被开发者广泛应用于轻量化AI应用、智能体开发等场景，GitHub仓库持续更新，累计下载量突破10万，有开发者基于该模型优化出更轻量化的部署方案，进一步降低了使用门槛，成为开源社区中“高效低成本”模型的代表之一。

Question 2

Longcat Flash Chat的API价格是多少？

Accepted Answer

Longcat Flash Chat的API价格信息暂未收录，请访问星盘大模型百科获取最新数据。

Question 3

Longcat Flash Chat支持哪些功能？

Accepted Answer

Longcat Flash Chat的功能特性信息暂未收录。

Question 4

Longcat Flash Chat是国产模型吗？

Accepted Answer

是的，Longcat Flash Chat是由MeiTuan开发的国产AI大模型，可直接访问使用。

Longcat Flash Chat

📖
词条百科 Wiki

📑 章节目录

Longcat Flash Chat 大模型深度百科

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

📊
能力雷达星图

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

⚡ 体验反馈与渠道测速

⚔️
性能对标产品

Hy3 preview(high)

Qwen3.6-27B(Thinking)

MiMo V2.5 Pro Base

MiMo V2.5 Base

社区真实评价

Longcat Flash Chat

📖词条百科 Wiki

📑 章节目录

Longcat Flash Chat 大模型深度百科

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

📊能力雷达星图

⏳模型家族构成

🔗 相关链接

💻使用与反馈

💰 计费模式与方案

⚡ 体验反馈与渠道测速

⚔️性能对标产品

Hy3 preview(high)

Qwen3.6-27B(Thinking)

MiMo V2.5 Pro Base

MiMo V2.5 Base

社区真实评价

📖
词条百科 Wiki

📊
能力雷达星图

💻
使用与反馈

⚔️
性能对标产品