Panoramica LLM

LLM Online in PapersGPT

Oggi, l'IA si sta evolvendo a una velocità vertiginosa, con nuovi modelli e tecnologie che emergono quasi ogni settimana. Questa corsa non mostra segni di rallentamento e le classifiche dei migliori modelli di IA cambiano quasi ogni settimana. Questa guida ti aiuterà a ottenere una panoramica dei vari LLM. Puoi utilizzare la maggior parte dei LLM in PapersGPT per chattare con i PDF. Ecco i modelli supportati da PapersGPT:

ProviderSupported Models
OpenAIgpt-5.1 | gpt-5 | gpt-5-min | gpt-5-nano | gpt-5-chat
gpt-4.1 | gpt-4.1-mini | gpt-4.1-nano
o4-mini-deep-research | gpt-4o-mini-search-preview | gpt-4o-search-preview
o3 | o4-mini | o3-mini | o1-mini
gpt-4o | chatgpt-4o-latest | gpt-4o-mini | gpt-4 | gpt-4-turbo | gpt-3.5-turbo
GeminiGemini 3 Pro Preview
2.5 Pro | Flash Latest | Flash Lite Latest | 2.5 Flash | 2.5 Flash-Lite
2.0 Flash | 2.0 Flash-Lite
ClaudeHaiku 4.5 | Sonnet 4.5 | Opus 4.1 | Opus 4 | Sonnet 4
Sonnet 3.7 | Sonnet 3.5 | Haiku 3.5
Opus 3 | Sonnet 3 | Haiku 3
DeepSeekDeepSeek 3.2 Exp
QwenQwen3-Max | Qwen-Plus | Qwen-Flash
qwen3-235b-a22b-thinking-2507 | qwen3-235b-a22b-instruct-2507
qwen3-30b-a3b-thinking-2507 | qwen3-30b-a3b-instruct-2507
MistralMagistral Medium | Magistral small | Mistral Medium 3 | Mistral Small 3.2 | Mistral Large
Kimikimi-k2-thinking | kimi-k2-0905-preview | kimi-k2-0711-preview | kimi-k2-turbo-preview
Z.aiglm-4.6 | glm-4.5 | glm-4.5-air | glm-4.5-flash
OpenRouterClaude Sonnet 4.5 | Gemini 2.5 Flash | Gemini 2.5 Pro | Grok 4 Fast | MiniMax M2 | Claude Sonnet 4 | Gemini 2.0 Flash | DeepSeek V3 0324 | Gemini 2.5 Flash Lite | GPT-4o-mini | Claude Haiku 4.5 | GLM 4.6 | Qwen3 235B A22B Instruct 2507 | gpt-oss-120b | DeepSeek R1T2 Chimera (free) | DeepSeek V3.1 | Gemini 2.5 Flash Preview 09-2025 | GPT-5 | GPT-5 Mini | Claude 3.7 Sonnet | Tongyi DeepResearch 30B A3B(free) | gpt-oss-20b(free) | Mistral Medium 3.1 | Qwen3 Next 80B A3B Thinking | Qwen3 Next 80B A3B Instruct | Claude Opus 4.1 | Kimi K2 0905 | Grok 4
SiliconFlowDeepSeek V3.1 Terminus | DeepSeek V3.1 | gpt-oss-120b | gpt-oss-20b | Kimi-K2-Instruct-0905 | Qwen3-Next-80B-A3B-Instruct | Ling-mini-2.0 | Ling-flash-2.0 | DeepSeek-V3 | DeepSeek-R1 | GLM-4.5 | GLM-4.5-Air | Qwen3-235B-A22B-Thinking-2507 | Qwen3-235B-A22B-Instruct-2507 | Qwen3-30B-A3B-Thinking-2507 | Qwen3-30B-A3B-Instruct-2507 | Kimi-K2-Instruct | ERNIE-4.5-300B-A47B | Hunyuan-A13B-Instruct | MiniMax-M1-80k

Nota che OpenRouter e SiliconFlow sono hub di modelli che forniscono i modelli SOTA più popolari.

Come Giudicare e Scegliere il Modello?

Con così tanti modelli sul mercato, come si sceglie quello giusto? Ecco due piattaforme a cui puoi fare riferimento:

OpenRouter, che contiene numerosi modelli e ha un gran numero di utenti. Pertanto, i primi 20 modelli più utilizzati elencati lì meritano considerazione. Tuttavia, è meglio dare priorità in base all'uso previsto, poiché alcuni modelli sono più adatti alla programmazione ma non necessariamente alla comprensione della lettura.

lmarena.ai, una piattaforma di benchmark LLM che valuta i modelli interamente attraverso confronti di valutazione umana, e la valutazione è anche un sistema di punteggio a scatola nera impostato secondo diversi scenari d'uso.

Inoltre, se utilizzi frequentemente i LLM, un modello economico è anche un fattore che vale la pena considerare nella scelta.