Comparaison des prix des LLM SOTA

Une clé API est nécessaire pour discuter avec des PDF dans PapersGPT pour les LLM en ligne

Presque tous les principaux LLM (grands modèles de langage) sont pris en charge dans PapersGPT, et la clé API LLM doit être fournie ou achetée par vous-même. Pour savoir quel LLM est le plus adapté pour vous, lequel est le plus rentable, voici quelques informations de référence.

Qu'est-ce qu'un token ?

Avant de faire une comparaison de prix, nous devons d'abord comprendre ce qu'est un token. Dans le domaine de l'Intelligence Artificielle et du Traitement du Langage Naturel, le token est l'unité de base du texte après segmentation. Le nombre de mots anglais contenus dans un token n'est pas fixe. En anglais, les mots courts courants tels que « the », « and » sont un token, tandis que les mots plus longs tels que « hesitation » sont également un token. En estimation approximative, en moyenne, un token anglais peut correspondre à 3 à 5 lettres.

Qu'est-ce qu'un modèle SOTA (State Of The Art) ?

Le « modèle LLM SOTA » est une cible en constante évolution. Et il n'existe pas un seul LLM « SOTA » (State-of-the-Art) universellement déclaré qui surclasse définitivement tous les autres sur tous les indicateurs. Au lieu de cela, ce qui est considéré comme SOTA dépend fortement des tâches spécifiques, des benchmarks et des critères d'évaluation. Différents modèles excellent dans différents domaines. Cependant, jusqu'en août 2025, les modèles intelligents de premier plan les plus utilisés et reconnus comprennent :

GPT 5, o1/2/3/4, GPT 4o (OpenAI) : C'est sans doute le modèle SOTA le plus largement reconnu et influent. Il excelle dans un large éventail de tâches, y compris le raisonnement, le codage, l'écriture créative, le suivi d'instructions complexes et les connaissances générales. Ses capacités sont vastes.

Gemini (Google) : S'appuyant sur le puissant système de développement de produits technologiques de Google, des puces de calcul massives et de vastes quantités de données de haute qualité, Gemini Pro 2.5 a rapidement balayé le sommet des principaux classements d'évaluation de modèles. Il s'est développé très rapidement, était très abordable et proposait une série de plans d'essai gratuits, capturant une grande part de marché.

Claude (Anthropic) : Un modèle très professionnel qui met l'accent sur l'utilisabilité pratique. Dans certains raisonnements complexes, en particulier dans le domaine du vibe coding, il est le meilleur et son effet dépasse largement les autres modèles sur le marché.

Grok 4 (xAI) : Grâce aux ressources financières, à la forte attractivité et à l'exécution de l'homme le plus riche du monde, Elon Musk, la série de modèles Grok 4 a connu un énorme succès et se trouve essentiellement en tête des classements des principales évaluations de modèles.

Les LLM de deuxième niveau les plus intelligents, se rapprochant du premier niveau et se développant rapidement, comprennent :

DeepSeek : Début 2025, grâce au lancement réussi de DeepSeek V3/R1, DeepSeek est passé de l'obscurité à un leader mondial du développement de modèles à grande échelle. Son principal argument de vente est son rapport coût-efficacité, nettement inférieur à celui des produits concurrents pour des performances comparables. Ses modèles sont également très intelligents, se rapprochant des performances de pointe. De plus, leur modèle entièrement open source permet une personnalisation et un déploiement faciles, réduisant considérablement la barrière d'entrée pour l'adoption de modèles à grande échelle.

Mistral : Venu d'Europe, connu pour son multilinguisme et sa nature open source. Sa dernière série Medium a obtenu de très bons résultats dans certaines évaluations et offre un support unique pour les langues minoritaires dans les pays européens, comme le français, l'allemand et l'italien.

Kimi : kimi-k2 est un nouveau modèle open source apparu en juillet 2025. Il a obtenu de très bons résultats dans une série d'évaluations, en particulier dans les scénarios d'utilisation de codage et d'agent, où ses avantages sont plus évidents.

Il existe de nombreux classements d'évaluation pour les LLM. Nous recommandons ici lmarena.ai. Sa principale caractéristique est d'utiliser une évaluation manuelle réelle et relativement subjective comme norme. Dans des conversations et des scénarios d'utilisation réels, des humains notent manuellement les LLM participants en boîte noire.

Quel est le modèle le plus rentable ?

Actuellement, dans le scénario de lecture d'articles, la plupart des modèles SOTA ou proches de SOTA fonctionnent très bien, sauf si l'article est très long ou contient un grand nombre de graphiques, etc. Par conséquent, il est très nécessaire de choisir un LLM avec un bon rapport coût-efficacité. Voici les derniers tarifs API des LLM SOTA que j'ai compilés jusqu'en août 2025.

ProviderModelInput Token PriceOutput Token Price
OpenAIgpt-5.1$1.25$10.00
gpt-5$1.25$10.00
gpt-5-mini$0.25$2.00
gpt-5-nano$0.05$0.40
gpt-5-chat$1.25$10.00
gpt-4.1$2.00$8.00
gpt-4.1-mini$0.40$1.60
gpt-4.1-nano$0.10$0.40
gpt-4o$2.50$10.00
gpt-4o-mini$0.15$0.60
o4-mini$1.10$4.40
o3-mini$1.10$4.40
o1-mini$1.10$4.40
GeminiGemini 3 Pro Preview$2$12
2.5 Pro$1.25$10
Flash Latest$0.3$2.5
Flash Lite Latest$0.1$0.4
2.5 Flash$0.30$2.5
2.5 Flash-Lite$0.1$0.4
2.0 Flash$0.1$0.4
2.0 Flash-Lite$0.075$0.3
ClaudeSonnet 4.5$3$15
Opus 4.1$15$75
Sonnet 4$3$15
Haiku 3.5$0.8$4
Opus 4$15$75
Opus 3$15$75
Sonnet 3.7$3$15
Haiku 3$0.25$1.25
xAIgrok-4-0709$3$15
DeepSeekChat / Reasoner$0.28$0.42
QwenQwen-Max$1.6$6.4
Qwen-Plus$0.4$1.2
Qwen-Flash$0.05$0.4
qwen3-235b-a22b-thinking-2507$0.7$8.4
qwen3-235b-a22b-instruct-2507$0.7$2.8
qwen3-30b-a3b-thinking-2507$0.2$2.4
qwen3-30b-a3b-instruct-2507$0.2$0.8
MistralMedium 3$0.4$2
Small 3.2$0.1$0.3
Large$2$6
Z.aiGLM 4.6$0.6$2.2
Kimikimi-k2-thinking$0.6$2.5
kimi-k2-0711-preview$0.6$2.5
kimi-k2-turbo-preview$2.4$10

La décision finale vous appartient

Bien qu'il existe divers LLM sur le marché, vous n'avez pas à vous inquiéter du choix. Le meilleur LLM et le plus abordable est déterminé par son utilisation pratique. Vous n'avez qu'à en choisir un dans PapersGPT et l'utiliser. Si vous pensez que l'effet n'est pas bon ou que le prix est trop élevé, vous pouvez passer à un autre modèle en un seul clic. C'est très pratique.