Comparação de Preços dos LLMs SOTA

É necessária API KEY para conversar com PDFs no PapersGPT usando LLMs online

Quase todos os principais LLMs (modelos de linguagem de grande escala) são suportados no PapersGPT, e a API KEY do LLM deve ser fornecida ou comprada por você. Sobre qual LLM é o mais adequado para você, qual é o mais econômico, a seguir fornecemos algumas informações de referência.

O que é o token?

Antes de fazer uma comparação de preços, primeiro precisamos entender o que é um token. No campo da Inteligência Artificial e Processamento de Linguagem Natural, Token é a unidade básica do texto após a segmentação. O número de palavras em inglês contidas em um Token não é fixo. Em inglês, palavras curtas comuns como "the" "and" são um Token, enquanto palavras mais longas como "hesitation" também são um Token. Como uma estimativa aproximada, em média, um Token em inglês pode corresponder a 3-5 letras.

O que é o Modelo SOTA (Estado da Arte)?

O "modelo LLM SOTA" é um alvo em constante movimento. E não existe um único LLM universalmente declarado como "SOTA" (Estado da Arte) que supere definitivamente todos os outros em todas as métricas. Em vez disso, o que é considerado SOTA depende muito de tarefas específicas, benchmarks e critérios de avaliação. Diferentes modelos se destacam em diferentes áreas. No entanto, até agosto de 2025, os modelos inteligentes de alto nível mais amplamente usados e reconhecidos incluem:

GPT 5, o1/2/3/4, GPT 4o (OpenAI): Este é indiscutivelmente o modelo SOTA mais amplamente reconhecido e influente. Ele se destaca em uma ampla gama de tarefas, incluindo raciocínio, codificação, redação criativa, seguimento de instruções complexas e conhecimento geral. Suas capacidades são vastas.

Gemini (Google): Aproveitando o poderoso sistema de desenvolvimento de produtos de tecnologia do Google, chips de computação massivos e grandes quantidades de dados de alta qualidade, o Gemini Pro 2.5 rapidamente alcançou o topo dos principais rankings de avaliação de modelos. Desenvolveu-se muito rapidamente, era muito acessível e tinha uma série de planos de teste gratuitos, conquistando uma grande participação de mercado.

Claude (Anthropic): Um modelo muito profissional que enfatiza a usabilidade prática. Em alguns raciocínios complexos, especialmente no campo de vibe coding, é o melhor e seu efeito supera em muito outros modelos no mercado.

Grok 4 (xAI): Graças aos recursos financeiros, forte apelo e execução do homem mais rico do mundo, Elon Musk, a série de modelos Grok 4 tem sido um enorme sucesso, e está basicamente no topo dos rankings das principais avaliações de modelos.

Os LLMs de segundo nível mais inteligentes, aproximando-se do primeiro nível e se desenvolvendo rapidamente, incluem:

DeepSeek: No início de 2025, graças ao lançamento bem-sucedido do DeepSeek V3/R1, o DeepSeek saltou da obscuridade para se tornar um líder global no desenvolvimento de modelos de grande escala. Seu principal atrativo é a relação custo-benefício, significativamente menor que os produtos concorrentes para desempenho comparável. Seus modelos também são altamente inteligentes, aproximando-se do desempenho de ponta. Além disso, seu modelo totalmente de código aberto permite fácil personalização e implantação, reduzindo significativamente a barreira de entrada para a adoção de modelos de grande escala.

Mistral: Vindo da Europa, conhecido por seu multilinguismo e natureza de código aberto. Sua mais recente série Medium alcançou resultados muito bons em algumas avaliações, e tem suporte único para idiomas minoritários em países europeus, como francês, alemão e italiano.

Kimi: kimi-k2 é um novo modelo de código aberto que surgiu em julho de 2025. Alcançou resultados muito bons em uma série de avaliações, especialmente nos cenários de uso de codificação e agente, onde suas vantagens são mais evidentes.

Existem muitos rankings de avaliação para LLMs. Aqui recomendamos lmarena.ai. Sua principal característica é usar a avaliação manual real e relativamente subjetiva como padrão. Em conversas e cenários de uso reais, humanos avaliam manualmente os LLMs participantes em caixa preta.

Qual é o modelo com melhor relação custo-benefício?

Atualmente, no cenário de leitura de artigos, a maioria dos modelos SOTA ou quase SOTA tem um desempenho muito bom, a menos que o artigo seja muito longo ou contenha um grande número de gráficos, etc. Portanto, é muito necessário escolher um LLM com boa relação custo-benefício. Abaixo está a precificação mais recente das APIs dos LLMs SOTA que compilei até agosto de 2025.

Provider	Model	Input Token Price	Output Token Price
OpenAI	gpt-5.1	$1.25	$10.00
	gpt-5	$1.25	$10.00
	gpt-5-mini	$0.25	$2.00
	gpt-5-nano	$0.05	$0.40
	gpt-5-chat	$1.25	$10.00
	gpt-4.1	$2.00	$8.00
	gpt-4.1-mini	$0.40	$1.60
	gpt-4.1-nano	$0.10	$0.40
	gpt-4o	$2.50	$10.00
	gpt-4o-mini	$0.15	$0.60
	o4-mini	$1.10	$4.40
	o3-mini	$1.10	$4.40
	o1-mini	$1.10	$4.40
Gemini	Gemini 3 Pro Preview	$2	$12
	2.5 Pro	$1.25	$10
	Flash Latest	$0.3	$2.5
	Flash Lite Latest	$0.1	$0.4
	2.5 Flash	$0.30	$2.5
	2.5 Flash-Lite	$0.1	$0.4
	2.0 Flash	$0.1	$0.4
	2.0 Flash-Lite	$0.075	$0.3
Claude	Sonnet 4.5	$3	$15
	Opus 4.1	$15	$75
	Sonnet 4	$3	$15
	Haiku 3.5	$0.8	$4
	Opus 4	$15	$75
	Opus 3	$15	$75
	Sonnet 3.7	$3	$15
	Haiku 3	$0.25	$1.25
xAI	grok-4-0709	$3	$15
DeepSeek	Chat / Reasoner	$0.28	$0.42
Qwen	Qwen-Max	$1.6	$6.4
	Qwen-Plus	$0.4	$1.2
	Qwen-Flash	$0.05	$0.4
	qwen3-235b-a22b-thinking-2507	$0.7	$8.4
	qwen3-235b-a22b-instruct-2507	$0.7	$2.8
	qwen3-30b-a3b-thinking-2507	$0.2	$2.4
	qwen3-30b-a3b-instruct-2507	$0.2	$0.8
Mistral	Medium 3	$0.4	$2
	Small 3.2	$0.1	$0.3
	Large	$2	$6
Z.ai	GLM 4.6	$0.6	$2.2
Kimi	kimi-k2-thinking	$0.6	$2.5
	kimi-k2-0711-preview	$0.6	$2.5
	kimi-k2-turbo-preview	$2.4	$10

A decisão final é sua

Embora existam vários LLMs no mercado, você não precisa se preocupar em escolher. O melhor e mais acessível LLM é determinado pelo seu uso prático. Você só precisa escolher um no PapersGPT e usá-lo. Se achar que o efeito não é bom ou o preço é muito alto, pode alternar para outro modelo com um clique. É muito conveniente.