SOTA 大语言模型定价对比

在 PapersGPT 中使用在线 LLM 与 PDF 对话需要 API KEY

PapersGPT 中集成了几乎所有主流的大语言模型（LLM），您需要自行提供或购买 LLM API KEY。哪个 LLM 最适合您、哪个性价比最高，下面为您提供一些参考信息。

什么是 Token？

在进行价格比较之前，我们首先需要弄清楚什么是 Token。在人工智能和自然语言处理领域，Token 是文本分词后的基本单位。一个 Token 包含的英文字数并不固定。在英语中，常见的短词如 "the" "and" 是一个 Token，而较长的词如 "hesitation" 也是一个 Token。粗略估计，平均一个英文 Token 可能对应 3-5 个字母。

什么是 SOTA（最先进）模型？

"SOTA LLM 模型" 是一个不断变化的目标。并没有单一、公认的 "SOTA"（最先进）大语言模型在所有指标上都能碾压其他模型。相反，什么被认为是 SOTA 很大程度上取决于具体的任务、基准和评估标准。不同模型在不同领域各有所长。然而，截至 2025 年 8 月，最广泛使用和公认的顶级智能模型包括：

GPT 5、o1/2/3/4、GPT 4o（OpenAI）：这可以说是最广泛认可和最具影响力的 SOTA 模型。它在推理、编码、创意写作、复杂指令遵循和通用知识等广泛任务中表现出色，能力非常全面。

Gemini（Google）：凭借 Google 强大的技术产品开发体系、海量计算芯片和大量高质量数据，Gemini Pro 2.5 迅速横扫各大模型评测排行榜榜首。它发展极快，价格实惠，并有一系列免费试用计划，抢占了大量市场份额。

Claude（Anthropic）：一个非常专业的模型，强调实用可用性。在一些复杂推理，特别是在 vibe coding 领域，它是最佳选择，效果远超市场上其他模型。

Grok 4（xAI）：得益于世界首富埃隆·马斯克的财力、强大号召力和执行力，Grok 4 系列模型大获成功，基本上位居各大模型评测排行榜前列。

最智能的第二梯队 LLM，接近第一梯队且发展迅速，包括：

DeepSeek：2025 年初，凭借 DeepSeek V3/R1 的成功发布，DeepSeek 从默默无闻一跃成为全球大模型开发的领导者。其主要卖点是性价比，同等性能下价格远低于竞品。其模型也非常智能，接近最先进水平。此外，其完全开源的模型允许轻松定制和部署，显著降低了大模型应用的门槛。

Mistral：来自欧洲，以其多语言性和开源特性而闻名。其最新的 Medium 系列在一些评测中取得了非常好的成绩，并且对欧洲国家的小语种有独特的支持，如法语、德语和意大利语。

Kimi：kimi-k2 是 2025 年 7 月出现的新型开源模型。它在一系列评测中取得了非常好的成绩，特别是在编码和 agent 的使用场景中，其优势更加明显。

目前有很多 LLM 评测排名。这里推荐 lmarena.ai。其主要特点是以实际且相对主观的人工评测作为标准。在实际对话和使用场景中，由人类手动对参与的黑盒 LLM 进行评分。

哪个模型性价比最高？

目前，在论文阅读场景中，大多数 SOTA 或接近 SOTA 的模型表现都非常好，除非论文非常长或包含大量图表等。因此，选择一个性价比好的 LLM 是非常必要的。以下是我整理截至 2025 年 8 月的最新 SOTA LLM API 定价。

Provider	Model	Input Token Price	Output Token Price
OpenAI	gpt-5.1	$1.25	$10.00
	gpt-5	$1.25	$10.00
	gpt-5-mini	$0.25	$2.00
	gpt-5-nano	$0.05	$0.40
	gpt-5-chat	$1.25	$10.00
	gpt-4.1	$2.00	$8.00
	gpt-4.1-mini	$0.40	$1.60
	gpt-4.1-nano	$0.10	$0.40
	gpt-4o	$2.50	$10.00
	gpt-4o-mini	$0.15	$0.60
	o4-mini	$1.10	$4.40
	o3-mini	$1.10	$4.40
	o1-mini	$1.10	$4.40
Gemini	Gemini 3 Pro Preview	$2	$12
	2.5 Pro	$1.25	$10
	Flash Latest	$0.3	$2.5
	Flash Lite Latest	$0.1	$0.4
	2.5 Flash	$0.30	$2.5
	2.5 Flash-Lite	$0.1	$0.4
	2.0 Flash	$0.1	$0.4
	2.0 Flash-Lite	$0.075	$0.3
Claude	Sonnet 4.5	$3	$15
	Opus 4.1	$15	$75
	Sonnet 4	$3	$15
	Haiku 3.5	$0.8	$4
	Opus 4	$15	$75
	Opus 3	$15	$75
	Sonnet 3.7	$3	$15
	Haiku 3	$0.25	$1.25
xAI	grok-4-0709	$3	$15
DeepSeek	Chat / Reasoner	$0.28	$0.42
Qwen	Qwen-Max	$1.6	$6.4
	Qwen-Plus	$0.4	$1.2
	Qwen-Flash	$0.05	$0.4
	qwen3-235b-a22b-thinking-2507	$0.7	$8.4
	qwen3-235b-a22b-instruct-2507	$0.7	$2.8
	qwen3-30b-a3b-thinking-2507	$0.2	$2.4
	qwen3-30b-a3b-instruct-2507	$0.2	$0.8
Mistral	Medium 3	$0.4	$2
	Small 3.2	$0.1	$0.3
	Large	$2	$6
Z.ai	GLM 4.6	$0.6	$2.2
Kimi	kimi-k2-thinking	$0.6	$2.5
	kimi-k2-0711-preview	$0.6	$2.5
	kimi-k2-turbo-preview	$2.4	$10

最终决定权在您手中

虽然市场上有各种 LLM，但您不必担心选择问题。最好和最实惠的 LLM 取决于实际使用效果。您只需在 PapersGPT 中选择一个并使用即可。如果您觉得效果不好或价格太高，可以一键切换到另一个模型，非常方便。