Comparación de Precios de LLMs SOTA

Se necesita API KEY para chatear con PDFs en PapersGPT usando LLMs en línea

Casi todos los LLMs (modelos de lenguaje de gran escala) principales son compatibles con PapersGPT, y la API KEY del LLM debe ser proporcionada o comprada por ti. Para saber qué LLM es el más adecuado para ti y cuál es más rentable, a continuación te ofrecemos información de referencia.

¿Qué es un token?

Antes de hacer una comparación de precios, primero debemos entender qué es un token. En el campo de la Inteligencia Artificial y el Procesamiento del Lenguaje Natural, el Token es la unidad básica de texto después de la segmentación. El número de palabras en inglés contenidas en un Token no es fijo. En inglés, palabras cortas comunes como "the" "and" son un Token, mientras que palabras más largas como "hesitation" también son un Token. Como estimación aproximada, en promedio, un Token en inglés puede corresponder a 3-5 letras.

¿Qué es el modelo SOTA (Estado del Arte)?

El "modelo LLM SOTA" es un objetivo en constante movimiento. Y no hay un solo LLM "SOTA" (Estado del Arte) universalmente declarado que supere definitivamente a todos los demás en cada métrica. En cambio, lo que se considera SOTA depende en gran medida de tareas específicas, puntos de referencia y criterios de evaluación. Diferentes modelos destacan en diferentes áreas. Sin embargo, hasta agosto de 2025, los modelos inteligentes de primer nivel más utilizados y reconocidos incluyen:

GPT 5, o1/2/3/4, GPT 4o (OpenAI): Este es posiblemente el modelo SOTA más ampliamente reconocido e influyente. Destaca en una amplia gama de tareas, incluyendo razonamiento, codificación, escritura creativa, seguimiento de instrucciones complejas y conocimiento general. Sus capacidades son vastas.

Gemini (Google): Aprovechando el potente sistema de desarrollo de productos tecnológicos de Google, chips de computación masivos y grandes cantidades de datos de alta calidad, Gemini Pro 2.5 rápidamente alcanzó la cima de los principales rankings de evaluación de modelos. Se desarrolló muy rápidamente, fue muy asequible y tuvo una serie de planes de prueba gratuitos, capturando una gran cuota de mercado.

Claude (Anthropic): Un modelo muy profesional que enfatiza la usabilidad práctica. En algunos razonamientos complejos, especialmente en el campo de la codificación vibe, es el mejor y su efecto supera con creces a otros modelos en el mercado.

Grok 4 (xAI): Gracias a los recursos financieros, el fuerte atractivo y la ejecución del hombre más rico del mundo, Elon Musk, la serie de modelos Grok 4 ha sido un gran éxito y básicamente está en la cima de los rankings de las principales revisiones de modelos.

Los LLMs de segundo nivel más inteligentes, que se acercan al primer nivel y se desarrollan rápidamente, incluyen:

DeepSeek: A principios de 2025, gracias al exitoso lanzamiento de DeepSeek V3/R1, DeepSeek pasó del anonimato a convertirse en un líder mundial en el desarrollo de modelos a gran escala. Su principal punto de venta es su relación costo-efectividad, significativamente más bajo que los productos de la competencia para un rendimiento comparable. Sus modelos también son altamente inteligentes, acercándose al rendimiento de vanguardia. Además, su modelo completamente de código abierto permite una fácil personalización e implementación, reduciendo significativamente la barrera de entrada para la adopción de modelos a gran escala.

Mistral: Procedente de Europa, conocido por su multilingüismo y naturaleza de código abierto. Su última serie Medium ha logrado muy buenos resultados en algunas revisiones, y tiene un soporte único para idiomas minoritarios en países europeos, como francés, alemán e italiano.

Kimi: kimi-k2 es un nuevo modelo de código abierto que surgió en julio de 2025. Ha logrado muy buenos resultados en una serie de evaluaciones, especialmente en los escenarios de uso de codificación y agente, donde sus ventajas son más obvias.

Hay muchos rankings de evaluación para LLMs. Aquí recomendamos lmarena.ai. Su característica principal es utilizar la evaluación manual real y relativamente subjetiva como estándar. En conversaciones y escenarios de uso reales, los humanos puntúan manualmente los LLMs de caja negra participantes.

¿Cuál es el modelo más rentable?

Actualmente, en el escenario de lectura de artículos, la mayoría de los modelos SOTA o cercanos a SOTA funcionan muy bien, a menos que el artículo sea muy largo o contenga una gran cantidad de gráficos, etc. Por lo tanto, es muy necesario elegir un LLM con buena relación costo-efectividad. A continuación se muestran los últimos precios de API de LLMs SOTA que he recopilado hasta agosto de 2025.

Provider	Model	Input Token Price	Output Token Price
OpenAI	gpt-5.1	$1.25	$10.00
	gpt-5	$1.25	$10.00
	gpt-5-mini	$0.25	$2.00
	gpt-5-nano	$0.05	$0.40
	gpt-5-chat	$1.25	$10.00
	gpt-4.1	$2.00	$8.00
	gpt-4.1-mini	$0.40	$1.60
	gpt-4.1-nano	$0.10	$0.40
	gpt-4o	$2.50	$10.00
	gpt-4o-mini	$0.15	$0.60
	o4-mini	$1.10	$4.40
	o3-mini	$1.10	$4.40
	o1-mini	$1.10	$4.40
Gemini	Gemini 3 Pro Preview	$2	$12
	2.5 Pro	$1.25	$10
	Flash Latest	$0.3	$2.5
	Flash Lite Latest	$0.1	$0.4
	2.5 Flash	$0.30	$2.5
	2.5 Flash-Lite	$0.1	$0.4
	2.0 Flash	$0.1	$0.4
	2.0 Flash-Lite	$0.075	$0.3
Claude	Sonnet 4.5	$3	$15
	Opus 4.1	$15	$75
	Sonnet 4	$3	$15
	Haiku 3.5	$0.8	$4
	Opus 4	$15	$75
	Opus 3	$15	$75
	Sonnet 3.7	$3	$15
	Haiku 3	$0.25	$1.25
xAI	grok-4-0709	$3	$15
DeepSeek	Chat / Reasoner	$0.28	$0.42
Qwen	Qwen-Max	$1.6	$6.4
	Qwen-Plus	$0.4	$1.2
	Qwen-Flash	$0.05	$0.4
	qwen3-235b-a22b-thinking-2507	$0.7	$8.4
	qwen3-235b-a22b-instruct-2507	$0.7	$2.8
	qwen3-30b-a3b-thinking-2507	$0.2	$2.4
	qwen3-30b-a3b-instruct-2507	$0.2	$0.8
Mistral	Medium 3	$0.4	$2
	Small 3.2	$0.1	$0.3
	Large	$2	$6
Z.ai	GLM 4.6	$0.6	$2.2
Kimi	kimi-k2-thinking	$0.6	$2.5
	kimi-k2-0711-preview	$0.6	$2.5
	kimi-k2-turbo-preview	$2.4	$10

La decisión final es tuya

Aunque hay varios LLMs en el mercado, no necesitas preocuparte por elegir. El mejor y más asequible LLM se determina por su uso práctico. Solo necesitas elegir uno en PapersGPT y usarlo. Si crees que el efecto no es bueno o el precio es demasiado alto, puedes cambiar a otro modelo con un solo clic. Es muy conveniente.