SOTA 大语言模型定价对比
在 PapersGPT 中使用在线 LLM 与 PDF 对话需要 API KEY
PapersGPT 中集成了几乎所有主流的大语言模型(LLM),您需要自行提供或购买 LLM API KEY。哪个 LLM 最适合您、哪个性价比最高,下面为您提供一些参考信息。
什么是 Token?
在进行价格比较之前,我们首先需要弄清楚什么是 Token。在人工智能和自然语言处理领域,Token 是文本分词后的基本单位。一个 Token 包含的英文字数并不固定。在英语中,常见的短词如 "the" "and" 是一个 Token,而较长的词如 "hesitation" 也是一个 Token。粗略估计,平均一个英文 Token 可能对应 3-5 个字母。
什么是 SOTA(最先进)模型?
"SOTA LLM 模型" 是一个不断变化的目标。并没有单一、公认的 "SOTA"(最先进)大语言模型在所有指标上都能碾压其他模型。相反,什么被认为是 SOTA 很大程度上取决于具体的任务、基准和评估标准。不同模型在不同领域各有所长。然而,截至 2025 年 8 月,最广泛使用和公认的顶级智能模型包括:
GPT 5、o1/2/3/4、GPT 4o(OpenAI):这可以说是最广泛认可和最具影响力的 SOTA 模型。它在推理、编码、创意写作、复杂指令遵循和通用知识等广泛任务中表现出色,能力非常全面。
Gemini(Google):凭借 Google 强大的技术产品开发体系、海量计算芯片和大量高质量数据,Gemini Pro 2.5 迅速横扫各大模型评测排行榜榜首。它发展极快,价格实惠,并有一系列免费试用计划,抢占了大量市场份额。
Claude(Anthropic):一个非常专业的模型,强调实用可用性。在一些复杂推理,特别是在 vibe coding 领域,它是最佳选择,效果远超市场上其他模型。
Grok 4(xAI):得益于世界首富埃隆·马斯克的财力、强大号召力和执行力,Grok 4 系列模型大获成功,基本上位居各大模型评测排行榜前列。
最智能的第二梯队 LLM,接近第一梯队且发展迅速,包括:
DeepSeek:2025 年初,凭借 DeepSeek V3/R1 的成功发布,DeepSeek 从默默无闻一跃成为全球大模型开发的领导者。其主要卖点是性价比,同等性能下价格远低于竞品。其模型也非常智能,接近最先进水平。此外,其完全开源的模型允许轻松定制和部署,显著降低了大模型应用的门槛。
Mistral:来自欧洲,以其多语言性和开源特性而闻名。其最新的 Medium 系列在一些评测中取得了非常好的成绩,并且对欧洲国家的小语种有独特的支持,如法语、德语和意大利语。
Kimi:kimi-k2 是 2025 年 7 月出现的新型开源模型。它在一系列评测中取得了非常好的成绩,特别是在编码和 agent 的使用场景中,其优势更加明显。
目前有很多 LLM 评测排名。这里推荐 lmarena.ai。其主要特点是以实际且相对主观的人工评测作为标准。在实际对话和使用场景中,由人类手动对参与的黑盒 LLM 进行评分。
哪个模型性价比最高?
目前,在论文阅读场景中,大多数 SOTA 或接近 SOTA 的模型表现都非常好,除非论文非常长或包含大量图表等。因此,选择一个性价比好的 LLM 是非常必要的。以下是我整理截至 2025 年 8 月的最新 SOTA LLM API 定价。
| Provider | Model | Input Token Price | Output Token Price |
|---|---|---|---|
| OpenAI | gpt-5.1 | $1.25 | $10.00 |
| gpt-5 | $1.25 | $10.00 | |
| gpt-5-mini | $0.25 | $2.00 | |
| gpt-5-nano | $0.05 | $0.40 | |
| gpt-5-chat | $1.25 | $10.00 | |
| gpt-4.1 | $2.00 | $8.00 | |
| gpt-4.1-mini | $0.40 | $1.60 | |
| gpt-4.1-nano | $0.10 | $0.40 | |
| gpt-4o | $2.50 | $10.00 | |
| gpt-4o-mini | $0.15 | $0.60 | |
| o4-mini | $1.10 | $4.40 | |
| o3-mini | $1.10 | $4.40 | |
| o1-mini | $1.10 | $4.40 | |
| Gemini | Gemini 3 Pro Preview | $2 | $12 |
| 2.5 Pro | $1.25 | $10 | |
| Flash Latest | $0.3 | $2.5 | |
| Flash Lite Latest | $0.1 | $0.4 | |
| 2.5 Flash | $0.30 | $2.5 | |
| 2.5 Flash-Lite | $0.1 | $0.4 | |
| 2.0 Flash | $0.1 | $0.4 | |
| 2.0 Flash-Lite | $0.075 | $0.3 | |
| Claude | Sonnet 4.5 | $3 | $15 |
| Opus 4.1 | $15 | $75 | |
| Sonnet 4 | $3 | $15 | |
| Haiku 3.5 | $0.8 | $4 | |
| Opus 4 | $15 | $75 | |
| Opus 3 | $15 | $75 | |
| Sonnet 3.7 | $3 | $15 | |
| Haiku 3 | $0.25 | $1.25 | |
| xAI | grok-4-0709 | $3 | $15 |
| DeepSeek | Chat / Reasoner | $0.28 | $0.42 |
| Qwen | Qwen-Max | $1.6 | $6.4 |
| Qwen-Plus | $0.4 | $1.2 | |
| Qwen-Flash | $0.05 | $0.4 | |
| qwen3-235b-a22b-thinking-2507 | $0.7 | $8.4 | |
| qwen3-235b-a22b-instruct-2507 | $0.7 | $2.8 | |
| qwen3-30b-a3b-thinking-2507 | $0.2 | $2.4 | |
| qwen3-30b-a3b-instruct-2507 | $0.2 | $0.8 | |
| Mistral | Medium 3 | $0.4 | $2 |
| Small 3.2 | $0.1 | $0.3 | |
| Large | $2 | $6 | |
| Z.ai | GLM 4.6 | $0.6 | $2.2 |
| Kimi | kimi-k2-thinking | $0.6 | $2.5 |
| kimi-k2-0711-preview | $0.6 | $2.5 | |
| kimi-k2-turbo-preview | $2.4 | $10 |
