SOTA 大语言模型定价对比

在 PapersGPT 中使用在线 LLM 与 PDF 对话需要 API KEY

PapersGPT 中集成了几乎所有主流的大语言模型(LLM),您需要自行提供或购买 LLM API KEY。哪个 LLM 最适合您、哪个性价比最高,下面为您提供一些参考信息。

什么是 Token?

在进行价格比较之前,我们首先需要弄清楚什么是 Token。在人工智能和自然语言处理领域,Token 是文本分词后的基本单位。一个 Token 包含的英文字数并不固定。在英语中,常见的短词如 "the" "and" 是一个 Token,而较长的词如 "hesitation" 也是一个 Token。粗略估计,平均一个英文 Token 可能对应 3-5 个字母。

什么是 SOTA(最先进)模型?

"SOTA LLM 模型" 是一个不断变化的目标。并没有单一、公认的 "SOTA"(最先进)大语言模型在所有指标上都能碾压其他模型。相反,什么被认为是 SOTA 很大程度上取决于具体的任务、基准和评估标准。不同模型在不同领域各有所长。然而,截至 2025 年 8 月,最广泛使用和公认的顶级智能模型包括:

GPT 5、o1/2/3/4、GPT 4o(OpenAI):这可以说是最广泛认可和最具影响力的 SOTA 模型。它在推理、编码、创意写作、复杂指令遵循和通用知识等广泛任务中表现出色,能力非常全面。

Gemini(Google):凭借 Google 强大的技术产品开发体系、海量计算芯片和大量高质量数据,Gemini Pro 2.5 迅速横扫各大模型评测排行榜榜首。它发展极快,价格实惠,并有一系列免费试用计划,抢占了大量市场份额。

Claude(Anthropic):一个非常专业的模型,强调实用可用性。在一些复杂推理,特别是在 vibe coding 领域,它是最佳选择,效果远超市场上其他模型。

Grok 4(xAI):得益于世界首富埃隆·马斯克的财力、强大号召力和执行力,Grok 4 系列模型大获成功,基本上位居各大模型评测排行榜前列。

最智能的第二梯队 LLM,接近第一梯队且发展迅速,包括:

DeepSeek:2025 年初,凭借 DeepSeek V3/R1 的成功发布,DeepSeek 从默默无闻一跃成为全球大模型开发的领导者。其主要卖点是性价比,同等性能下价格远低于竞品。其模型也非常智能,接近最先进水平。此外,其完全开源的模型允许轻松定制和部署,显著降低了大模型应用的门槛。

Mistral:来自欧洲,以其多语言性和开源特性而闻名。其最新的 Medium 系列在一些评测中取得了非常好的成绩,并且对欧洲国家的小语种有独特的支持,如法语、德语和意大利语。

Kimi:kimi-k2 是 2025 年 7 月出现的新型开源模型。它在一系列评测中取得了非常好的成绩,特别是在编码和 agent 的使用场景中,其优势更加明显。

目前有很多 LLM 评测排名。这里推荐 lmarena.ai。其主要特点是以实际且相对主观的人工评测作为标准。在实际对话和使用场景中,由人类手动对参与的黑盒 LLM 进行评分。

哪个模型性价比最高?

目前,在论文阅读场景中,大多数 SOTA 或接近 SOTA 的模型表现都非常好,除非论文非常长或包含大量图表等。因此,选择一个性价比好的 LLM 是非常必要的。以下是我整理截至 2025 年 8 月的最新 SOTA LLM API 定价。

ProviderModelInput Token PriceOutput Token Price
OpenAIgpt-5.1$1.25$10.00
gpt-5$1.25$10.00
gpt-5-mini$0.25$2.00
gpt-5-nano$0.05$0.40
gpt-5-chat$1.25$10.00
gpt-4.1$2.00$8.00
gpt-4.1-mini$0.40$1.60
gpt-4.1-nano$0.10$0.40
gpt-4o$2.50$10.00
gpt-4o-mini$0.15$0.60
o4-mini$1.10$4.40
o3-mini$1.10$4.40
o1-mini$1.10$4.40
GeminiGemini 3 Pro Preview$2$12
2.5 Pro$1.25$10
Flash Latest$0.3$2.5
Flash Lite Latest$0.1$0.4
2.5 Flash$0.30$2.5
2.5 Flash-Lite$0.1$0.4
2.0 Flash$0.1$0.4
2.0 Flash-Lite$0.075$0.3
ClaudeSonnet 4.5$3$15
Opus 4.1$15$75
Sonnet 4$3$15
Haiku 3.5$0.8$4
Opus 4$15$75
Opus 3$15$75
Sonnet 3.7$3$15
Haiku 3$0.25$1.25
xAIgrok-4-0709$3$15
DeepSeekChat / Reasoner$0.28$0.42
QwenQwen-Max$1.6$6.4
Qwen-Plus$0.4$1.2
Qwen-Flash$0.05$0.4
qwen3-235b-a22b-thinking-2507$0.7$8.4
qwen3-235b-a22b-instruct-2507$0.7$2.8
qwen3-30b-a3b-thinking-2507$0.2$2.4
qwen3-30b-a3b-instruct-2507$0.2$0.8
MistralMedium 3$0.4$2
Small 3.2$0.1$0.3
Large$2$6
Z.aiGLM 4.6$0.6$2.2
Kimikimi-k2-thinking$0.6$2.5
kimi-k2-0711-preview$0.6$2.5
kimi-k2-turbo-preview$2.4$10

最终决定权在您手中

虽然市场上有各种 LLM,但您不必担心选择问题。最好和最实惠的 LLM 取决于实际使用效果。您只需在 PapersGPT 中选择一个并使用即可。如果您觉得效果不好或价格太高,可以一键切换到另一个模型,非常方便。