聚合LMSYS Arena、SuperCLUE、OpenRouter、Artificial Analysis等权威榜单数据,多维度评测AI模型能力
基于全网数百万真实人类盲测投票的AI大模型能力排行,涵盖代码、数学、创意写作等八大维度
中文大模型评测基准排行榜,综合评估AI模型中文理解与生成能力
基于OpenRouter平台真实API调用数据的AI模型使用排行,反映模型实际受欢迎程度
Artificial Analysis综合评测排行榜,涵盖文本、图像、视频、音频等多模态AI能力
专家级问题处理能力
困难提示词处理能力
代码生成与理解能力
数学推理与计算能力
创意内容生成能力
指令理解与执行能力
长文本处理能力
综合总分排行
代码生成能力排行
数学推理能力排行
指令遵循能力排行
科学推理能力排行
幻觉控制能力排行
智能体能力排行
综合使用热度排行
编程场景使用排行
极速响应场景排行
图像处理场景排行
长文本场景排行
权威基准场景排行
音频处理场景排行
热门应用场景排行
多语言场景排行
工具调用场景排行
厂商市场份额排行
文本生成图像能力排行
文本生成视频能力排行
图片生成视频能力排行
文字转语音能力排行
图像编辑与修改能力排行
器乐音乐生成能力排行
人声演唱生成能力排行