Confronto Prezzi LLM SOTA

Usare LLM Online con PDF in PapersGPT Richiede una Chiave API

PapersGPT supporta quasi tutti i LLM mainstream (Modelli Linguistici di Grandi Dimensioni), la chiave API LLM dovrebbe essere fornita o acquistata da te. Per quanto riguarda quale LLM è più adatto a te e quale è più economico, ecco alcune informazioni di riferimento qui sotto.

Cos'è un Token?

Prima di fare il confronto dei prezzi, dobbiamo prima chiarire cos'è un token. Nel campo dell'intelligenza artificiale e dell'elaborazione del linguaggio naturale, il token è l'unità di base dopo la tokenizzazione del testo. Il numero di lettere inglesi contenute in un token non è fisso. In inglese, parole brevi comuni come 'the' e 'and' contano ciascuna come un token, mentre parole più lunghe come 'hesitation' contano anch'esse come un token. Una stima approssimativa, un token inglese medio può corrispondere a 3-5 lettere.

Cos'è un Modello SOTA (Stato dell'Arte)?

"Il modello SOTA LLM" è un obiettivo in continua evoluzione. Non esiste un LLM universalmente proclamato 'SOTA' che possa superare assolutamente tutti gli altri modelli in tutte le metriche. Piuttosto, ciò che costituisce SOTA dipende in gran parte dai compiti specifici, dai benchmark e dai criteri di valutazione. Modelli diversi hanno punti di forza in aree diverse. Tuttavia, a partire da agosto 2025, i modelli più ampiamente utilizzati e riconosciuti per l'intelligenza di punta includono:

GPT 5, o1/2/3/4, GPT 4o (OpenAI): Questo è probabilmente il modello SOTA più ampiamente riconosciuto e influente. Eccelle in un'ampia gamma di compiti come ragionamento, programmazione, scrittura creativa, seguire istruzioni complesse e conoscenza del senso comune, con capacità molto complete.

Gemini (Google): Con il potente sistema di sviluppo prodotto tecnico di Google, enormi chip di calcolo e grandi quantità di dati di alta qualità, Gemini Pro 2.5 ha rapidamente conquistato le prime posizioni in varie classifiche di valutazione dei modelli. Si evolve molto rapidamente, ha prezzi accessibili e ha una serie di piani di prova gratuiti, conquistando una grande quota di mercato.

Claude (Anthropic): Un modello molto professionale, che enfatizza l'usabilità pratica. In alcuni ragionamenti complessi, specialmente nel campo del vibe coding, è il migliore e il suo effetto supera di gran lunga altri modelli sul mercato.

Grok 4 (xAI): Con la potenza finanziaria dell'uomo più ricco del mondo Elon Musk e la sua capacità di influenza ed esecuzione, la serie di modelli Grok 4 ha ottenuto un grande successo, stabilizzandosi sostanzialmente in cima a varie classifiche di valutazione.

Il secondo livello più intelligente di LLM, che si avvicina al primo livello e si sviluppa rapidamente, include:

DeepSeek: All'inizio del 2025, con il rilascio di successo di DeepSeek V3/R1, DeepSeek è passato dall'oscurità alla leadership nel campo dello sviluppo di modelli di grandi dimensioni a livello globale. Il suo principale punto di forza è il rapporto prestazioni-prezzo estremamente elevato, offrendo prestazioni comparabili a prezzi significativamente inferiori rispetto ai concorrenti. I suoi modelli sono anche altamente intelligenti, vicini allo stato dell'arte. Inoltre, i suoi modelli completamente open source facilitano la personalizzazione e la distribuzione, abbassando notevolmente la soglia per l'applicazione di modelli di grandi dimensioni.

Mistral: Proveniente dall'Europa, noto per il suo carattere multilingue e open source. La sua ultima serie Medium ha ottenuto ottimi risultati in alcune valutazioni e offre un supporto unico per le lingue minoritarie dei paesi europei (come francese, tedesco e italiano).

Kimi: kimi-k2 è un nuovo modello open source emerso a luglio 2025. Ha ottenuto ottimi risultati in una serie di valutazioni, specialmente nella programmazione e negli scenari di utilizzo degli agenti, i suoi vantaggi sono ancora più evidenti.

Ci sono molte classifiche di valutazione LLM. Qui raccomandiamo lmarena.ai, che si caratterizza principalmente per valutazioni umane pratiche e relativamente soggettive come standard. Negli scenari di dialogo e utilizzo reali, i LLM a scatola nera partecipanti alla valutazione vengono valutati dagli esseri umani.

Quale Modello è il Più Conveniente?

Attualmente, negli scenari di lettura di articoli, la maggior parte dei modelli SOTA o quasi SOTA funziona molto bene, a meno che l'articolo non sia molto lungo o contenga molti grafici, ecc. Pertanto, è molto necessario scegliere un LLM con un buon rapporto qualità-prezzo. Di seguito sono riportati gli ultimi prezzi API dei LLM SOTA che ho raccolto ad agosto 2025.

ProviderModelInput Token PriceOutput Token Price
OpenAIgpt-5.1$1.25$10.00
gpt-5$1.25$10.00
gpt-5-mini$0.25$2.00
gpt-5-nano$0.05$0.40
gpt-5-chat$1.25$10.00
gpt-4.1$2.00$8.00
gpt-4.1-mini$0.40$1.60
gpt-4.1-nano$0.10$0.40
gpt-4o$2.50$10.00
gpt-4o-mini$0.15$0.60
o4-mini$1.10$4.40
o3-mini$1.10$4.40
o1-mini$1.10$4.40
GeminiGemini 3 Pro Preview$2$12
2.5 Pro$1.25$10
Flash Latest$0.3$2.5
Flash Lite Latest$0.1$0.4
2.5 Flash$0.30$2.5
2.5 Flash-Lite$0.1$0.4
2.0 Flash$0.1$0.4
2.0 Flash-Lite$0.075$0.3
ClaudeSonnet 4.5$3$15
Opus 4.1$15$75
Sonnet 4$3$15
Haiku 3.5$0.8$4
Opus 4$15$75
Opus 3$15$75
Sonnet 3.7$3$15
Haiku 3$0.25$1.25
xAIgrok-4-0709$3$15
DeepSeekChat / Reasoner$0.28$0.42
QwenQwen-Max$1.6$6.4
Qwen-Plus$0.4$1.2
Qwen-Flash$0.05$0.4
qwen3-235b-a22b-thinking-2507$0.7$8.4
qwen3-235b-a22b-instruct-2507$0.7$2.8
qwen3-30b-a3b-thinking-2507$0.2$2.4
qwen3-30b-a3b-instruct-2507$0.2$0.8
MistralMedium 3$0.4$2
Small 3.2$0.1$0.3
Large$2$6
Z.aiGLM 4.6$0.6$2.2
Kimikimi-k2-thinking$0.6$2.5
kimi-k2-0711-preview$0.6$2.5
kimi-k2-turbo-preview$2.4$10

La Decisione Finale Spetta a Te

Sebbene ci siano vari LLM sul mercato, non devi preoccuparti della scelta. Il LLM migliore e più economico dipende dal suo effetto d'uso effettivo. Devi solo sceglierne uno in PapersGPT e usarlo. Se ritieni che l'effetto non sia buono o il prezzo sia troppo alto, puoi passare a un altro modello con un clic, il che è molto conveniente.