AI大模型排行榜

聚合LMSYS Arena、SuperCLUE、OpenRouter、Artificial Analysis等权威榜单数据，多维度评测AI模型能力

🏆 综合实力 Top 5

查看完整榜单 →

排名	模型	机构	评分
🥇	Gemma 3 27B IT	Google
🥈	Amazon Nova Experimental Chat 11 10	Amazon
🥉	GLM 4.7 Flash	Zhipu
#4	Qwen 3 Next 80B A3B Thinking	alibaba
#5	Claude 3.7 Sonnet 20250219	Anthropic

📊 权威榜单

LMSYS Arena 大模型权威排行榜

基于全网数百万真实人类盲测投票的AI大模型能力排行，涵盖代码、数学、创意写作等八大维度

查看榜单 →

SuperCLUE 中文大模型排行榜

中文大模型评测基准排行榜，综合评估AI模型中文理解与生成能力

查看榜单 →

OpenRouter 调用数据排行榜

基于OpenRouter平台真实API调用数据的AI模型使用排行，反映模型实际受欢迎程度

查看榜单 →

Artificial Analysis AI能力评测排行榜

Artificial Analysis综合评测排行榜，涵盖文本、图像、视频、音频等多模态AI能力

查看榜单 →

🎯 Arena 维度排行

专家

专家级问题处理能力

困难对话

困难提示词处理能力

代码

代码生成与理解能力

数学

数学推理与计算能力

创意写作

创意内容生成能力

指令遵循

指令理解与执行能力

长文本

长文本处理能力

🏆 SuperCLUE 维度排行

总分

综合总分排行

代码生成

代码生成能力排行

数学推理

数学推理能力排行

指令遵循

指令遵循能力排行

科学推理

科学推理能力排行

幻觉控制

幻觉控制能力排行

智能体

智能体能力排行

🔀 OpenRouter 场景排行

综合热度

综合使用热度排行

编程专项

编程场景使用排行

极速响应

极速响应场景排行

图像处理

图像处理场景排行

长文本

长文本场景排行

权威基准

权威基准场景排行

音频处理

音频处理场景排行

热门应用

热门应用场景排行

多语言

多语言场景排行

工具调用

工具调用场景排行

厂商份额

厂商市场份额排行

📊 AA 细分排行

文生图

文本生成图像能力排行

文生视频

文本生成视频能力排行

图生视频

图片生成视频能力排行

语音合成

文字转语音能力排行

图像编辑

图像编辑与修改能力排行

器乐生成

器乐音乐生成能力排行

人声演唱

人声演唱生成能力排行