🔭
AI文档解析排行榜 - 大模型PDF文档理解能力排名
Arena
AI大模型文档理解能力排行榜,基于LMSYS Arena盲测,测试模型阅读分析长文档、PDF解析、排版理解的能力
💬 文本 (Chat)
👁️ 视觉理解
🔍 联网搜索
📄 文档解析
💻 代码 (Code)
🌐 前端开发
🖼️ 看图写代码
🎨 图像 (Image)
🖼️ 文生图 (Arena)
✂️ 图像编辑 (Arena)
📊 AA 图像基准
🎬 视频 (Video)
🎥 视频生成 (Arena)
🎞️ 视频编辑 (Arena)
📊 AA 视频基准
🎵 音频 (Audio)
🎙️ AA 音频基准
总榜排名
↑
模型名称
研发机构
1
Claude 4.6 Opus Thinking
Anthropic
2
Claude 4.7 Opus
Anthropic
3
Claude 4.6 Opus
Anthropic
4
Claude 4.7 Opus Thinking
Anthropic
5
GPT 5.5 High
OpenAI
6
Claude 4.6 Sonnet
Anthropic
7
GPT 5.5
OpenAI
8
GPT 5.4
OpenAI
9
Claude 4.5 Opus 20251101
Anthropic
10
Muse Spark
Meta
11
Kimi K2.6
moonshot
12
Claude 4.5 Sonnet 20250929
Anthropic
13
Gemini 3.1 Pro Preview
Google
14
Gemini 3 Pro
Google
15
Kimi K2.5 Thinking
Moonshot
16
Gemini 2.5 Pro
Google
17
Gemma 4 31B
Google
18
Claude 4.5 Haiku 20251001
Anthropic
19
Grok 4.20 Beta Reasoning
xAI
20
Gemini 3 Flash
Google
21
GPT 5.2 High
OpenAI
22
GPT 5.2 Chat
OpenAI
24
GPT 5.5 Instant
OpenAI