Aperçu des LLM

LLM en ligne dans PapersGPT

Aujourd'hui, l'IA progresse à un rythme très rapide, avec de nouveaux modèles et techniques qui apparaissent presque chaque semaine. La course ne montre aucun signe de ralentissement, le classement des meilleurs modèles d'IA changeant presque chaque semaine. Ce guide vous aidera à obtenir un aperçu des LLM. Vous pouvez utiliser la plupart des LLM dans PapersGPT pour discuter avec des PDF. Voici les modèles pris en charge dans PapersGPT :

ProviderSupported Models
OpenAIgpt-5.1 | gpt-5 | gpt-5-min | gpt-5-nano | gpt-5-chat
gpt-4.1 | gpt-4.1-mini | gpt-4.1-nano
o4-mini-deep-research | gpt-4o-mini-search-preview | gpt-4o-search-preview
o3 | o4-mini | o3-mini | o1-mini
gpt-4o | chatgpt-4o-latest | gpt-4o-mini | gpt-4 | gpt-4-turbo | gpt-3.5-turbo
GeminiGemini 3 Pro Preview
2.5 Pro | Flash Latest | Flash Lite Latest | 2.5 Flash | 2.5 Flash-Lite
2.0 Flash | 2.0 Flash-Lite
ClaudeHaiku 4.5 | Sonnet 4.5 | Opus 4.1 | Opus 4 | Sonnet 4
Sonnet 3.7 | Sonnet 3.5 | Haiku 3.5
Opus 3 | Sonnet 3 | Haiku 3
DeepSeekDeepSeek 3.2 Exp
QwenQwen3-Max | Qwen-Plus | Qwen-Flash
qwen3-235b-a22b-thinking-2507 | qwen3-235b-a22b-instruct-2507
qwen3-30b-a3b-thinking-2507 | qwen3-30b-a3b-instruct-2507
MistralMagistral Medium | Magistral small | Mistral Medium 3 | Mistral Small 3.2 | Mistral Large
Kimikimi-k2-thinking | kimi-k2-0905-preview | kimi-k2-0711-preview | kimi-k2-turbo-preview
Z.aiglm-4.6 | glm-4.5 | glm-4.5-air | glm-4.5-flash
OpenRouterClaude Sonnet 4.5 | Gemini 2.5 Flash | Gemini 2.5 Pro | Grok 4 Fast | MiniMax M2 | Claude Sonnet 4 | Gemini 2.0 Flash | DeepSeek V3 0324 | Gemini 2.5 Flash Lite | GPT-4o-mini | Claude Haiku 4.5 | GLM 4.6 | Qwen3 235B A22B Instruct 2507 | gpt-oss-120b | DeepSeek R1T2 Chimera (free) | DeepSeek V3.1 | Gemini 2.5 Flash Preview 09-2025 | GPT-5 | GPT-5 Mini | Claude 3.7 Sonnet | Tongyi DeepResearch 30B A3B(free) | gpt-oss-20b(free) | Mistral Medium 3.1 | Qwen3 Next 80B A3B Thinking | Qwen3 Next 80B A3B Instruct | Claude Opus 4.1 | Kimi K2 0905 | Grok 4
SiliconFlowDeepSeek V3.1 Terminus | DeepSeek V3.1 | gpt-oss-120b | gpt-oss-20b | Kimi-K2-Instruct-0905 | Qwen3-Next-80B-A3B-Instruct | Ling-mini-2.0 | Ling-flash-2.0 | DeepSeek-V3 | DeepSeek-R1 | GLM-4.5 | GLM-4.5-Air | Qwen3-235B-A22B-Thinking-2507 | Qwen3-235B-A22B-Instruct-2507 | Qwen3-30B-A3B-Thinking-2507 | Qwen3-30B-A3B-Instruct-2507 | Kimi-K2-Instruct | ERNIE-4.5-300B-A47B | Hunyuan-A13B-Instruct | MiniMax-M1-80k

Veuillez noter qu'OpenRouter et SiliconFlow sont des hubs de modèles qui fournissent les modèles SOTA les plus populaires.

Comment évaluer et choisir un modèle ?

Avec autant de modèles disponibles sur le marché, comment choisir le bon ? Voici deux plateformes de référence à considérer :

OpenRouter, qui contient de nombreux modèles et est utilisé par un grand nombre d'utilisateurs. Par conséquent, les 20 modèles les plus utilisés énumérés ci-dessus méritent d'être pris en compte. Cependant, il est préférable de les prioriser en fonction de leur utilisation prévue, car certains modèles sont mieux adaptés au codage mais pas nécessairement à la compréhension de lecture.

lmarena.ai, une plateforme de benchmark LLM, qui évalue les modèles uniquement par évaluation comparative manuelle, et l'évaluation est également un système de notation en boîte noire configuré selon différents scénarios d'utilisation.

De plus, si vous utilisez fréquemment des LLM, un modèle économique avec un bon rapport coût-efficacité est également un point à prendre en compte lors du choix.