SOTA LLM Prijsvergelijking

API KEY is nodig om PDF's te chatten in PapersGPT voor online LLM's

Bijna alle gangbare LLM's (large language models) worden ondersteund in PapersGPT, en de LLM API KEY moet door uzelf worden verstrekt of gekocht. Welke LLM het meest geschikt is voor u, welke het meest kosteneffectief is, het volgende geeft u wat referentie-informatie.

Wat is een token?

Voordat we een prijsvergelijking maken, moeten we eerst begrijpen wat een token is. Op het gebied van Kunstmatige Intelligentie en Natuurlijke Taalverwerking is Token de basiseenheid van tekst na segmentatie. Het aantal Engelse woorden in een Token is niet vast. In het Engels zijn veelvoorkomende korte woorden zoals "the" "and" één Token, terwijl langere woorden zoals "hesitation" ook één Token zijn. Als ruwe schatting komt een Engels Token gemiddeld overeen met 3-5 letters.

Wat is het SOTA (State Of The Art) Model?

Het "SOTA LLM-model" is een voortdurend bewegend doel. En er is geen enkel, universeel verklaard "SOTA" (State-of-the-Art) LLM dat alle andere definitief overtreft op elke afzonderlijke metriek. In plaats daarvan hangt wat als SOTA wordt beschouwd sterk af van specifieke taken, benchmarks en evaluatiecriteria. Verschillende modellen blinken uit op verschillende gebieden. Echter, tot augustus 2025 behoren de meest gebruikte en erkende topmodellen tot:

GPT 5, o1/2/3/4, GPT 4o (OpenAI): Dit is waarschijnlijk het meest erkende en invloedrijke SOTA-model. Het blinkt uit in een breed scala aan taken, waaronder redeneren, programmeren, creatief schrijven, het volgen van complexe instructies en algemene kennis. De mogelijkheden zijn enorm.

Gemini (Google): Gebruikmakend van Google's krachtige technologieproductontwikkelingssysteem, enorme rekenchips en grote hoeveelheden hoogwaardige gegevens, heeft Gemini Pro 2.5 snel de top van de belangrijkste modelevaluatieranglijsten bereikt. Het ontwikkelde zich zeer snel, was zeer betaalbaar en had een reeks gratis proefabonnementen, waardoor het een groot marktaandeel verwierf.

Claude (Anthropic): Een zeer professioneel model dat de nadruk legt op praktische bruikbaarheid. In sommige complexe redeneringen, vooral op het gebied van vibe coding, is het de beste en het effect ervan overtreft ruimschoots andere modellen op de markt.

Grok 4 (xAI): Dankzij de financiële middelen, sterke aantrekkingskracht en uitvoeringskracht van 's werelds rijkste man, Elon Musk, is de Grok 4-serie modellen een enorm succes geweest en staat deze in wezen bovenaan de ranglijsten van belangrijke modelbeoordelingen.

De slimste tweede-niveau LLM's, die het eerste niveau benaderen en zich snel ontwikkelen, zijn onder meer:

DeepSeek: Begin 2025, dankzij de succesvolle lancering van DeepSeek V3/R1, schoot DeepSeek vanuit de vergetelheid omhoog tot een wereldleider in grootschalige modelontwikkeling. Het belangrijkste verkoopargument is de kosteneffectiviteit, aanzienlijk lager dan concurrerende producten voor vergelijkbare prestaties. De modellen zijn ook zeer intelligent en benaderen state-of-the-art prestaties. Bovendien maakt hun volledig open-source model eenvoudige aanpassing en implementatie mogelijk, waardoor de toegangsdrempel voor grootschalige modelacceptatie aanzienlijk wordt verlaagd.

Mistral: Komt uit Europa, bekend om zijn meertaligheid en open source karakter. De nieuwste Medium-serie heeft zeer goede resultaten behaald in sommige beoordelingen en heeft unieke ondersteuning voor minderheidstalen in Europese landen, zoals Frans, Duits en Italiaans.

Kimi: kimi-k2 is een nieuw open source model dat in juli 2025 opkwam. Het heeft zeer goede resultaten behaald in een reeks evaluaties, vooral in de gebruiksscenario's van programmeren en agent, waar de voordelen duidelijker zijn.

Er zijn veel evaluatieranglijsten voor LLM's. Hier wordt lmarena.ai aanbevolen. Het belangrijkste kenmerk is het gebruik van daadwerkelijke en relatief subjectieve handmatige evaluatie als standaard. In daadwerkelijke gesprekken en gebruiksscenario's scoren mensen handmatig de deelnemende black-box LLM's.

Wat is het meest kosteneffectieve model?

Momenteel presteren de meeste SOTA- of bijna-SOTA-modellen in het scenario van het lezen van papers zeer goed, tenzij de paper erg lang is of een groot aantal diagrammen bevat, enz. Daarom is het zeer noodzakelijk om een LLM met een goede kosteneffectiviteit te kiezen. Hieronder vindt u de nieuwste SOTA LLM API-prijzen die ik tot augustus 2025 heb samengesteld.

Provider	Model	Input Token Price	Output Token Price
OpenAI	gpt-5.1	$1.25	$10.00
	gpt-5	$1.25	$10.00
	gpt-5-mini	$0.25	$2.00
	gpt-5-nano	$0.05	$0.40
	gpt-5-chat	$1.25	$10.00
	gpt-4.1	$2.00	$8.00
	gpt-4.1-mini	$0.40	$1.60
	gpt-4.1-nano	$0.10	$0.40
	gpt-4o	$2.50	$10.00
	gpt-4o-mini	$0.15	$0.60
	o4-mini	$1.10	$4.40
	o3-mini	$1.10	$4.40
	o1-mini	$1.10	$4.40
Gemini	Gemini 3 Pro Preview	$2	$12
	2.5 Pro	$1.25	$10
	Flash Latest	$0.3	$2.5
	Flash Lite Latest	$0.1	$0.4
	2.5 Flash	$0.30	$2.5
	2.5 Flash-Lite	$0.1	$0.4
	2.0 Flash	$0.1	$0.4
	2.0 Flash-Lite	$0.075	$0.3
Claude	Sonnet 4.5	$3	$15
	Opus 4.1	$15	$75
	Sonnet 4	$3	$15
	Haiku 3.5	$0.8	$4
	Opus 4	$15	$75
	Opus 3	$15	$75
	Sonnet 3.7	$3	$15
	Haiku 3	$0.25	$1.25
xAI	grok-4-0709	$3	$15
DeepSeek	Chat / Reasoner	$0.28	$0.42
Qwen	Qwen-Max	$1.6	$6.4
	Qwen-Plus	$0.4	$1.2
	Qwen-Flash	$0.05	$0.4
	qwen3-235b-a22b-thinking-2507	$0.7	$8.4
	qwen3-235b-a22b-instruct-2507	$0.7	$2.8
	qwen3-30b-a3b-thinking-2507	$0.2	$2.4
	qwen3-30b-a3b-instruct-2507	$0.2	$0.8
Mistral	Medium 3	$0.4	$2
	Small 3.2	$0.1	$0.3
	Large	$2	$6
Z.ai	GLM 4.6	$0.6	$2.2
Kimi	kimi-k2-thinking	$0.6	$2.5
	kimi-k2-0711-preview	$0.6	$2.5
	kimi-k2-turbo-preview	$2.4	$10

De uiteindelijke beslissing is aan u

Hoewel er verschillende LLM's op de markt zijn, hoeft u zich geen zorgen te maken over het kiezen. De beste en meest betaalbare LLM wordt bepaald door het praktische gebruik ervan. U hoeft er slechts één te kiezen in PapersGPT en deze te gebruiken. Als u vindt dat het effect niet goed is of de prijs te hoog, kunt u met één klik naar een ander model overschakelen. Het is erg handig.