大语言模型概览

PapersGPT 中的在线大语言模型

如今,AI 正以极快的速度发展,几乎每周都有新模型和新技术涌现。这场竞赛没有放缓的迹象,顶尖 AI 模型的排行榜几乎每周都在变化。本指南将帮助您了解大语言模型的概况。您可以在 PapersGPT 中使用大多数大语言模型与 PDF 对话。以下是 PapersGPT 支持的模型:

ProviderSupported Models
OpenAIgpt-5.1 | gpt-5 | gpt-5-min | gpt-5-nano | gpt-5-chat
gpt-4.1 | gpt-4.1-mini | gpt-4.1-nano
o4-mini-deep-research | gpt-4o-mini-search-preview | gpt-4o-search-preview
o3 | o4-mini | o3-mini | o1-mini
gpt-4o | chatgpt-4o-latest | gpt-4o-mini | gpt-4 | gpt-4-turbo | gpt-3.5-turbo
GeminiGemini 3 Pro Preview
2.5 Pro | Flash Latest | Flash Lite Latest | 2.5 Flash | 2.5 Flash-Lite
2.0 Flash | 2.0 Flash-Lite
ClaudeHaiku 4.5 | Sonnet 4.5 | Opus 4.1 | Opus 4 | Sonnet 4
Sonnet 3.7 | Sonnet 3.5 | Haiku 3.5
Opus 3 | Sonnet 3 | Haiku 3
DeepSeekDeepSeek 3.2 Exp
QwenQwen3-Max | Qwen-Plus | Qwen-Flash
qwen3-235b-a22b-thinking-2507 | qwen3-235b-a22b-instruct-2507
qwen3-30b-a3b-thinking-2507 | qwen3-30b-a3b-instruct-2507
MistralMagistral Medium | Magistral small | Mistral Medium 3 | Mistral Small 3.2 | Mistral Large
Kimikimi-k2-thinking | kimi-k2-0905-preview | kimi-k2-0711-preview | kimi-k2-turbo-preview
Z.aiglm-4.6 | glm-4.5 | glm-4.5-air | glm-4.5-flash
OpenRouterClaude Sonnet 4.5 | Gemini 2.5 Flash | Gemini 2.5 Pro | Grok 4 Fast | MiniMax M2 | Claude Sonnet 4 | Gemini 2.0 Flash | DeepSeek V3 0324 | Gemini 2.5 Flash Lite | GPT-4o-mini | Claude Haiku 4.5 | GLM 4.6 | Qwen3 235B A22B Instruct 2507 | gpt-oss-120b | DeepSeek R1T2 Chimera (free) | DeepSeek V3.1 | Gemini 2.5 Flash Preview 09-2025 | GPT-5 | GPT-5 Mini | Claude 3.7 Sonnet | Tongyi DeepResearch 30B A3B(free) | gpt-oss-20b(free) | Mistral Medium 3.1 | Qwen3 Next 80B A3B Thinking | Qwen3 Next 80B A3B Instruct | Claude Opus 4.1 | Kimi K2 0905 | Grok 4
SiliconFlowDeepSeek V3.1 Terminus | DeepSeek V3.1 | gpt-oss-120b | gpt-oss-20b | Kimi-K2-Instruct-0905 | Qwen3-Next-80B-A3B-Instruct | Ling-mini-2.0 | Ling-flash-2.0 | DeepSeek-V3 | DeepSeek-R1 | GLM-4.5 | GLM-4.5-Air | Qwen3-235B-A22B-Thinking-2507 | Qwen3-235B-A22B-Instruct-2507 | Qwen3-30B-A3B-Thinking-2507 | Qwen3-30B-A3B-Instruct-2507 | Kimi-K2-Instruct | ERNIE-4.5-300B-A47B | Hunyuan-A13B-Instruct | MiniMax-M1-80k

请注意,OpenRouter 和 SiliconFlow 是提供最流行 SOTA 模型的模型中心。

如何判断和选择模型?

市面上有如此多的模型,该如何选择合适的呢?以下是两个可供参考的平台:

OpenRouter,它包含大量模型,拥有众多用户。因此,上面列出的使用量前 20 的模型值得考虑。不过,最好根据使用场景来优先选择,因为有些模型更适合编码,但不一定适合阅读理解。

lmarena.ai,一个 LLM 基准测试平台,完全通过人工对比评估来评判模型,该评估也是根据不同使用场景设置的黑盒评分系统。

此外,如果您经常使用 LLM,选择一个经济实惠的模型也是值得考虑的因素。