Question 1

Grok 4是什么？

Accepted Answer

一、简介与定位

美国马斯克旗下xAI团队于太平洋时间2025年7月9日，正式发布了其旗舰级纯推理大模型Grok 4，定位为具备顶尖推理能力、多场景适配的通用型大模型。

Grok一词源自罗伯特·海因莱因的小说《异乡异客》，寓意“深度理解”，后缀无特殊含义，核心功能涵盖高阶逻辑推理、实时联网获取信息、X平台内容调用、多智能体协作，以及语音交互、AI伴侣等衍生功能；官方使用门槛明确，免费账号仅可使用Grok 3，Grok 4需订阅SuperGrok服务（每月30美元），SuperGrok Heavy（每月300美元）可独享Grok 4 Heavy版本及专属权益，API暂未开放免费额度，仅向付费订阅用户提供接口权限，同期发布的兄弟模型为Grok 4 Heavy，主打多代理并行工作能力。

目前Grok 4处于生命周期中的主力阶段，尚未被淘汰，且已推出Grok 4.2公测版进行迭代优化；其最突出的核心特点是推理能力较前代提升10倍，采用多智能体协作架构，兼顾高效响应与低幻觉率，同时深度绑定X平台生态。

二、发展历程

2.1 研发背景

Grok 4发布前，行业内主流大模型主要有OpenAI的GPT-4系列、Google的Gemini系列、Anthropic的Claude 4等。其中GPT-4系列优势在于生态完善、多模态能力成熟，但存在幻觉率偏高、实时信息获取滞后的痛点；Gemini系列擅长多模态融合，却在复杂逻辑推理场景表现一般；Claude 4以长文本处理见长，但算力成本高昂、响应速度较慢。彼时大模型行业正处于“算力竞赛”向“精度竞赛”转型的关键期，用户对模型的推理准确性、实时性、多场景适配性需求大幅提升，同时AI幻觉问题成为行业普遍亟待解决的难题，xAI团队基于自身算力优势和差异化定位，推出了主打“高推理、低幻觉、强协同”的Grok 4，试图在高端通用大模型领域打破现有格局。

2.2 关键节点

2023年3月，马斯克在美国内华达州注册成立xAI团队，4月xAI公司正式成立，宗旨为“理解宇宙的本质”，7月团队正式启动大模型研发工作；同年11月，xAI发布首款大模型Grok，纳入X平台Premium+订阅计划，12月向美国Premium+用户开放，完成初步市场验证。2024年，xAI持续迭代，3月推出Grok 1.5优化长语境理解能力，8月发布Grok 2，强化聊天、编码与推理能力；2025年1月，推出Grok独立应用及网页版，2月发布Grok 3并免费向公众开放，迅速提升用户基数。经过多代产品的技术积累与数据沉淀，太平洋时间2025年7月9日，xAI正式发布Grok 4及Grok 4 Heavy，马斯克高调宣称其为“世界上最强AI模型”；2026年2月，Grok 4.2公测版上线，新增快速学习能力，持续优化模型性能。

2.3 家族构成

Grok系列大模型形成了清晰的代际演进体系，各型号定位差异明确，适配不同用户需求：

Grok（初代）：xAI于2023年11月发布的首款产品，定位为实验性聊天机器人，核心特点是具备幽默感、可联网获取X平台信息，支持回答部分“辛辣问题”，主要用于市场试水和技术积累，仅向X平台Premium+订阅用户开放。

Grok 1：2024年3月发布，参数量达3140亿，遵照Apache2.0协议开源，定位为开源实验型模型，为后续产品提供底层技术支撑，在Human Eval代码生成任务上准确率达63.2%，MMLU数据集测试准确率达73%。

Grok 1.5：2024年3月推出，在Grok 1基础上优化，定位为长语境优化版模型，重点提升长文本理解和高级推理能力，为后续模型的上下文窗口升级奠定基础。

Grok 2：2024年8月发布，定位为进阶型通用模型，具备顶尖的聊天、编码和推理能力，同时强化文本与视觉理解功能，训练量较前代大幅提升，性能接近GPT-4系列。

Grok 3：2025年2月发布，定位为大众普及型模型，免费向公众开放，上线后迅速登顶美国区App Store免费APP榜首，新增语音模式，优化用户交互体验，为Grok 4积累了大量用户数据。

Grok 4：2025年7月发布的旗舰级纯推理模型，定位为高端通用型大模型，主打高阶推理、低幻觉和多智能体协作，面向付费订阅用户，是目前xAI的核心主力产品。

Grok 4 Heavy：与Grok 4同期发布，定位为专业级高性能模型，采用多代理并行架构，支持四个代理同时工作，上下文窗口最高达256k tokens，面向高端专业用户和企业客户，需单独订阅SuperGrok Heavy服务。

Grok 4.2：2026年2月推出的公测版，定位为Grok 4的迭代优化版，新增快速学习能力，进一步降低幻觉率，优化响应速度，为正式版迭代收集用户反馈。

三、核心技术剖析

3.1 固有技术

Grok 4继承了Grok系列前代模型的核心底层技术，基础架构采用标准Transformer稠密架构，延续了自回归语言生成模式，确保文本生成的流畅性和连贯性。在对齐手段上，沿用了xAI自研的强化学习对齐方案（RLHF），通过人类反馈持续优化模型输出，减少有害内容和不符合人类认知的回答；同时继承了Grok 3的实时联网能力和X平台内容调用接口，可实时抓取互联网及X平台的最新信息，解决了传统大模型知识库滞后的问题。此外，其还延续了Grok 2的工具调用基础，将代码解释器、搜索引擎等工具纳入训练流程，为后续多智能体协作和复杂任务处理提供了技术支撑。

3.2 创新技术

Grok 4的核心创新集中在架构优化、幻觉控制和性能提升三个方面，具体解读如下：

1. 多智能体辩论架构（核心创新）：Grok 4 Heavy率先采用该架构，Grok 4后续迭代中逐步适配，打破了传统大模型“单脑思考”的局限，由四个分工明确的智能体协同工作——协调者负责拆解问题、分配任务和裁决分歧，研究员负责实时事实核查，逻辑学家专攻数学、代码等推理任务并排查逻辑漏洞，创意者负责优化表达和补充多元视角。这种架构相当于在模型内部建立了同行评议机制，可在毫秒级内实现互相纠错，大幅降低幻觉率，Grok 4.2版本的非幻觉率已达78%，较前代降低65%。

2. 强化学习算力升级：Grok 4的强化学习计算量较Grok 2提升100倍，较Grok 3提升10倍，这也是其推理能力提升10倍的核心原因。通过加大强化学习投入，模型在复杂推理、学科测试等场景的准确率大幅提升，能够轻松应对SAT、GRE等高阶考试，在AIME25、HMMT25等数学竞赛中取得近满分表现。

3. 超大上下文窗口与高效推理优化：Grok 4支持最高256k tokens的上下文窗口，可一次性处理整本技术手册、数年财务报表或完整项目代码库，解决了前代模型长文本遗忘的痛点；同时优化了推理引擎，响应速度较早期版本缩短一半，单位成本推理效率达到业界最佳，兼顾了长文本处理能力和响应速度。

4. 每周自迭代系统：Grok 4引入了快速学习能力，底层架构具备每周自我迭代的功能，每次更新都会同步发布详细说明，明确改进内容和功能变化，打破了传统大模型“训练完即冻结”的静态模式，实现了模型能力的持续进化。

四、表现评估

4.1 历史与现状

Grok 4刚发布时，凭借马斯克的个人影响力和“世界最强AI模型”的宣传，迅速引发行业关注，发布初期在Artificial Analysis全套基准测试中取得73分的成绩，领先于同期的GPT-4 o3、Gemini 2.5 Pro等模型，一度占据高端大模型榜首位置，吸引了大量付费订阅用户。截至2026年4月，Grok 4仍是xAI的主力产品，已迭代至4.2公测版，优化了快速学习能力和幻觉控制，但随着GPT-5、Gemini 3等新一代模型的发布，其行业领先地位有所下滑，目前稳居全球高端大模型第一梯队，核心优势仍集中在推理能力和多智能体协作上，用户群体以海外付费个人用户和部分企业客户为主。

4.2 优势亮点

结合业内权威排行榜和媒体跑分数据，Grok 4的优势主要集中在以下三个维度，表现突出：

1. 推理能力顶尖：在ARC-AGI v2评测中，Grok 4准确率达15.9%，几乎是第二名Claude 4（8.6%）的两倍，创下该基准测试的SOTA纪录；在HLE（人类最后的考试）中，Grok 4使用工具后的成绩达38.6%，Grok 4 Heavy更是提升至44.4%，刷新行业纪录；在AIME25、HMMT25等数学竞赛中，Grok 4 Heavy取得100%、96.7%的近满分表现，被马斯克称为“达到人类博士后水平”。

2. 复杂任务处理能力突出：在Vending-Bench商业模拟场景测试中，Grok 4平均净资产达4684.15美元，是第二名Claude 4的两倍，证明其在长周期、复杂决策场景中的优势；同时，其可依托工具调用能力，完成黑洞合并可视化、CRISPR基因编辑假设筛选等专业任务，适配科研、金融等高端场景。

3. 低幻觉与高实时性：Grok 4.2版本在Artificial Analysis评估中，非幻觉率达78%，面对未知领域时能主动承认“不知道”，大幅降低虚假信息输出；同时依托X平台生态，可实时抓取每天约6800万条英文帖子，实时信息获取能力优于多数同类模型，能快速响应热点问题。

4.3 缺点与不足

尽管Grok 4表现出色，但仍存在明显短板，客观短板如下：

1. 代码能力薄弱：这是Grok 4最突出的短板，实测中其代码生成、调试能力远落后于GPT-4、DeepSeek R1等模型，在LCB（编程竞赛）等基准测试中表现不佳，xAI也计划在2025年8月专门推出代码模型弥补这一缺陷。

2. 多语言支持不足：模型主要优化英文场景，中文处理能力较弱，存在翻译偏差、中文语境理解不到位的问题，中文语音交互也存在口音问题，适配非英文用户的体验较差。

3. 功能迭代不均衡：过度侧重推理能力和AI伴侣等娱乐化功能，图像生成、音频识别等多模态功能仍处于开发中，相较于GPT-4、Gemini等模型，多模态适配性不足。

4. 宣传与实际存在差距：马斯克宣称其为“世界上最强AI模型”，但实测中仅在推理、数学等特定维度领先，综合能力与GPT-4 o3、Gemini 2.5 Pro相比并无绝对优势，部分场景下的响应速度和输出流畅度甚至略逊于同类产品。

五、重大事件

1. 2025年7月9日Grok 4正式发布，马斯克高调宣称其为“世界上最强AI模型”，引发行业广泛讨论，发布当日相关话题冲上X平台热搜榜首，带动Grok独立应用下载量大幅提升，同时其公布的基准测试数据引发部分业内人士质疑，认为存在数据美化嫌疑。

2. 2025年7月中下旬，Grok 4推出“AI伴侣”功能，首批上线哥特风女孩Ani、卡通小熊猫“坏鲁迪”等角色，其中二次元形象Ani迅速出圈，带动Grok在日本、中国香港地区的下载量登顶当地应用商店榜首，引发网友广泛玩梗和二次创作，同时也因部分角色设定引发争议。

3. 2025年7月18日，马斯克宣布推出“AI男友”Valentine，以《异乡异客》主人公命名，进一步丰富AI伴侣矩阵，截至2025年10月，Grok已推出5个AI伴侣角色，持续通过娱乐化功能吸引用户，提升用户停留时长。

4. 2025年11月14日，马斯克在专访中透露Grok 5计划于2026年第一季度发布，参数量达6万亿，有10%概率实现通用人工智能（AGI），该言论引发学术界和行业内对AGI发展速度的热议，同时也提升了市场对Grok系列模型的关注度。

5. 2026年2月，xAI与美国军方签署协议，允许美国军方在机密系统中使用Grok 4，这一事件引发公众对AI伦理和安全的讨论，部分人士担忧高端AI技术用于军事领域的潜在风险，同时也提升了Grok 4的商业价值。

6. 2026年2月18日，Grok 4.2公测版上线，首次引入快速学习能力和优化后的多智能体辩论架构，非幻觉率达78%，创下行业纪录，引发技术爱好者和开发者的广泛关注，同时推动聚合镜像站等第三方平台同步接入该版本。

六、局限与妥协

6.1 客观局限

Grok 4作为海外大模型，国内用户和普通开发者使用时面临诸多客观局限：一是存在IP封锁，国内用户无法直接访问xAI官方平台和Grok独立应用，需借助科学上网工具，存在合规风险；二是订阅门槛较高，SuperGrok服务每月30美元，SuperGrok Heavy每月300美元，且需绑定海外信用卡，国内普通用户和中小开发者难以承担；三是算力成本高昂，若需本地部署或大规模调用API，需依托高性能GPU，普通开发者难以支撑；四是功能适配性不足，模型主要优化英文场景，中文用户体验较差，且部分功能（如AI伴侣）需依赖X平台，国内用户无法正常使用。此外，xAI暂未开放Grok 4的开源权限，普通开发者无法进行二次微调，进一步限制了其在国内的应用场景。

6.2 妥协办法

针对上述局限，国内用户和开发者可采用以下妥协方案：一是通过合规的云厂商代理平台，间接体验Grok 4的核心功能，无需自行解决IP和支付问题；二是借助受信任的第三方API聚合平台，按需调用Grok 4的接口，降低使用成本；三是对于无需高阶推理能力的场景，可选用Grok 2.5等开源版本（xAI已开源Grok 2.5）作为平替，满足基础使用需求；四是通过海外朋友协助订阅，或使用虚拟海外信用卡完成订阅，间接使用官方服务（需注意合规风险）。

Question 2

Grok 4的API价格是多少？

Accepted Answer

Grok 4的API输入价格为21.7500元/百万Token，输出价格为108.7500元/百万Token。

Question 3

Grok 4支持哪些功能？

Accepted Answer

Grok 4的功能特性信息暂未收录。

Question 4

Grok 4是国产模型吗？

Accepted Answer

Grok 4是由xAI开发的AI大模型，可能需要网络代理访问。

Grok 4

📖
词条百科 Wiki

📑 章节目录

# 一、简介与定位

# 二、发展历程

# 2.1 研发背景

# 2.2 关键节点

# 2.3 家族构成

# 三、核心技术剖析

# 3.1 固有技术

# 3.2 创新技术

# 四、表现评估

# 4.1 历史与现状

# 4.2 优势亮点

# 4.3 缺点与不足

# 五、重大事件

# 六、局限与妥协

# 6.1 客观局限

# 6.2 妥协办法

📊
能力雷达星图

数据采集中

⏳模型家族构成

🔗 相关链接

💻
使用与反馈

💰 计费模式与方案

🤝 第三方代理 / 聚合 API

平台：OpenRouter 模型：Grok 4

⚡ 体验反馈与渠道测速

🤝 第三方测速反馈

⚔️
性能对标产品

Doubao-Seed-2.0-lite-260428(high)

Qwen3.7-Max(Thinking)

Claude Opus 4.7 (high)

Gemini 3.5 Flash (high)

社区真实评价