Resumen de LLMs

LLMs en línea en PapersGPT

Hoy en día, la IA avanza a un ritmo muy rápido, con nuevos modelos y técnicas que aparecen casi cada semana. La carrera no muestra signos de desaceleración, con la clasificación de los mejores modelos de IA cambiando casi semanalmente. Esta guía te ayudará a obtener una visión general de los LLMs. Puedes usar la mayoría de los LLMs en PapersGPT para chatear con PDFs. A continuación se muestran los modelos compatibles con PapersGPT:

Provider	Supported Models
OpenAI	gpt-5.1 \| gpt-5 \| gpt-5-min \| gpt-5-nano \| gpt-5-chat
	gpt-4.1 \| gpt-4.1-mini \| gpt-4.1-nano
	o4-mini-deep-research \| gpt-4o-mini-search-preview \| gpt-4o-search-preview
	o3 \| o4-mini \| o3-mini \| o1-mini
	gpt-4o \| chatgpt-4o-latest \| gpt-4o-mini \| gpt-4 \| gpt-4-turbo \| gpt-3.5-turbo
Gemini	Gemini 3 Pro Preview
	2.5 Pro \| Flash Latest \| Flash Lite Latest \| 2.5 Flash \| 2.5 Flash-Lite
	2.0 Flash \| 2.0 Flash-Lite
Claude	Haiku 4.5 \| Sonnet 4.5 \| Opus 4.1 \| Opus 4 \| Sonnet 4
	Sonnet 3.7 \| Sonnet 3.5 \| Haiku 3.5
	Opus 3 \| Sonnet 3 \| Haiku 3
DeepSeek	DeepSeek 3.2 Exp
Qwen	Qwen3-Max \| Qwen-Plus \| Qwen-Flash
	qwen3-235b-a22b-thinking-2507 \| qwen3-235b-a22b-instruct-2507
	qwen3-30b-a3b-thinking-2507 \| qwen3-30b-a3b-instruct-2507
Mistral	Magistral Medium \| Magistral small \| Mistral Medium 3 \| Mistral Small 3.2 \| Mistral Large
Kimi	kimi-k2-thinking \| kimi-k2-0905-preview \| kimi-k2-0711-preview \| kimi-k2-turbo-preview
Z.ai	glm-4.6 \| glm-4.5 \| glm-4.5-air \| glm-4.5-flash
OpenRouter	Claude Sonnet 4.5 \| Gemini 2.5 Flash \| Gemini 2.5 Pro \| Grok 4 Fast \| MiniMax M2 \| Claude Sonnet 4 \| Gemini 2.0 Flash \| DeepSeek V3 0324 \| Gemini 2.5 Flash Lite \| GPT-4o-mini \| Claude Haiku 4.5 \| GLM 4.6 \| Qwen3 235B A22B Instruct 2507 \| gpt-oss-120b \| DeepSeek R1T2 Chimera (free) \| DeepSeek V3.1 \| Gemini 2.5 Flash Preview 09-2025 \| GPT-5 \| GPT-5 Mini \| Claude 3.7 Sonnet \| Tongyi DeepResearch 30B A3B(free) \| gpt-oss-20b(free) \| Mistral Medium 3.1 \| Qwen3 Next 80B A3B Thinking \| Qwen3 Next 80B A3B Instruct \| Claude Opus 4.1 \| Kimi K2 0905 \| Grok 4
SiliconFlow	DeepSeek V3.1 Terminus \| DeepSeek V3.1 \| gpt-oss-120b \| gpt-oss-20b \| Kimi-K2-Instruct-0905 \| Qwen3-Next-80B-A3B-Instruct \| Ling-mini-2.0 \| Ling-flash-2.0 \| DeepSeek-V3 \| DeepSeek-R1 \| GLM-4.5 \| GLM-4.5-Air \| Qwen3-235B-A22B-Thinking-2507 \| Qwen3-235B-A22B-Instruct-2507 \| Qwen3-30B-A3B-Thinking-2507 \| Qwen3-30B-A3B-Instruct-2507 \| Kimi-K2-Instruct \| ERNIE-4.5-300B-A47B \| Hunyuan-A13B-Instruct \| MiniMax-M1-80k

Ten en cuenta que OpenRouter y SiliconFlow son centros de modelos que proporcionan los modelos SOTA más populares.

¿Cómo juzgar y elegir un modelo?

Con tantos modelos disponibles en el mercado, ¿cómo elegir el adecuado? Aquí hay dos plataformas de referencia a considerar:

OpenRouter, que contiene numerosos modelos y es utilizado por un gran número de usuarios. Por lo tanto, los 20 modelos más utilizados mencionados anteriormente vale la pena considerarlos. Sin embargo, es mejor priorizarlos según su uso previsto, ya que algunos modelos son más adecuados para programación pero no necesariamente para comprensión de lectura.

lmarena.ai, una plataforma de evaluación comparativa de LLMs, que juzga los modelos mediante evaluación comparativa manual, y la evaluación también es un sistema de puntuación de caja negra configurado según diferentes escenarios de uso.

Provider	Supported Models
OpenAI	gpt-5.1 \| gpt-5 \| gpt-5-min \| gpt-5-nano \| gpt-5-chat
	gpt-4.1 \| gpt-4.1-mini \| gpt-4.1-nano
	o4-mini-deep-research \| gpt-4o-mini-search-preview \| gpt-4o-search-preview
	o3 \| o4-mini \| o3-mini \| o1-mini
	gpt-4o \| chatgpt-4o-latest \| gpt-4o-mini \| gpt-4 \| gpt-4-turbo \| gpt-3.5-turbo
Gemini	Gemini 3 Pro Preview
	2.5 Pro \| Flash Latest \| Flash Lite Latest \| 2.5 Flash \| 2.5 Flash-Lite
	2.0 Flash \| 2.0 Flash-Lite
Claude	Haiku 4.5 \| Sonnet 4.5 \| Opus 4.1 \| Opus 4 \| Sonnet 4
	Sonnet 3.7 \| Sonnet 3.5 \| Haiku 3.5
	Opus 3 \| Sonnet 3 \| Haiku 3
DeepSeek	DeepSeek 3.2 Exp
Qwen	Qwen3-Max \| Qwen-Plus \| Qwen-Flash
	qwen3-235b-a22b-thinking-2507 \| qwen3-235b-a22b-instruct-2507
	qwen3-30b-a3b-thinking-2507 \| qwen3-30b-a3b-instruct-2507
Mistral	Magistral Medium \| Magistral small \| Mistral Medium 3 \| Mistral Small 3.2 \| Mistral Large
Kimi	kimi-k2-thinking \| kimi-k2-0905-preview \| kimi-k2-0711-preview \| kimi-k2-turbo-preview
Z.ai	glm-4.6 \| glm-4.5 \| glm-4.5-air \| glm-4.5-flash
OpenRouter	Claude Sonnet 4.5 \| Gemini 2.5 Flash \| Gemini 2.5 Pro \| Grok 4 Fast \| MiniMax M2 \| Claude Sonnet 4 \| Gemini 2.0 Flash \| DeepSeek V3 0324 \| Gemini 2.5 Flash Lite \| GPT-4o-mini \| Claude Haiku 4.5 \| GLM 4.6 \| Qwen3 235B A22B Instruct 2507 \| gpt-oss-120b \| DeepSeek R1T2 Chimera (free) \| DeepSeek V3.1 \| Gemini 2.5 Flash Preview 09-2025 \| GPT-5 \| GPT-5 Mini \| Claude 3.7 Sonnet \| Tongyi DeepResearch 30B A3B(free) \| gpt-oss-20b(free) \| Mistral Medium 3.1 \| Qwen3 Next 80B A3B Thinking \| Qwen3 Next 80B A3B Instruct \| Claude Opus 4.1 \| Kimi K2 0905 \| Grok 4
SiliconFlow	DeepSeek V3.1 Terminus \| DeepSeek V3.1 \| gpt-oss-120b \| gpt-oss-20b \| Kimi-K2-Instruct-0905 \| Qwen3-Next-80B-A3B-Instruct \| Ling-mini-2.0 \| Ling-flash-2.0 \| DeepSeek-V3 \| DeepSeek-R1 \| GLM-4.5 \| GLM-4.5-Air \| Qwen3-235B-A22B-Thinking-2507 \| Qwen3-235B-A22B-Instruct-2507 \| Qwen3-30B-A3B-Thinking-2507 \| Qwen3-30B-A3B-Instruct-2507 \| Kimi-K2-Instruct \| ERNIE-4.5-300B-A47B \| Hunyuan-A13B-Instruct \| MiniMax-M1-80k

Resumen de LLMs

LLMs en línea en PapersGPT

Ten en cuenta que OpenRouter y SiliconFlow son centros de modelos que proporcionan los modelos SOTA más populares.

¿Cómo juzgar y elegir un modelo?

Con tantos modelos disponibles en el mercado, ¿cómo elegir el adecuado? Aquí hay dos plataformas de referencia a considerar:

lmarena.ai, una plataforma de evaluación comparativa de LLMs, que juzga los modelos mediante evaluación comparativa manual, y la evaluación también es un sistema de puntuación de caja negra configurado según diferentes escenarios de uso.

Además, si usas LLMs con frecuencia, un modelo económico y rentable también es un punto que vale la pena considerar al elegir.