Przegląd modeli LLM

Modele LLM online w PapersGPT

Obecnie sztuczna inteligencja rozwija się w bardzo szybkim tempie, a nowe modele i techniki pojawiają się niemal co tydzień. Wyścig nie wykazuje oznak spowolnienia, a ranking najlepszych modeli AI zmienia się praktycznie co tydzień. Ten przewodnik pomoże Ci uzyskać ogólny obraz modeli LLM. Większości z nich możesz używać w PapersGPT do czatowania z plikami PDF. Poniżej znajdują się modele obsługiwane w PapersGPT:

Provider	Supported Models
OpenAI	gpt-5.1 \| gpt-5 \| gpt-5-min \| gpt-5-nano \| gpt-5-chat
	gpt-4.1 \| gpt-4.1-mini \| gpt-4.1-nano
	o4-mini-deep-research \| gpt-4o-mini-search-preview \| gpt-4o-search-preview
	o3 \| o4-mini \| o3-mini \| o1-mini
	gpt-4o \| chatgpt-4o-latest \| gpt-4o-mini \| gpt-4 \| gpt-4-turbo \| gpt-3.5-turbo
Gemini	Gemini 3 Pro Preview
	2.5 Pro \| Flash Latest \| Flash Lite Latest \| 2.5 Flash \| 2.5 Flash-Lite
	2.0 Flash \| 2.0 Flash-Lite
Claude	Haiku 4.5 \| Sonnet 4.5 \| Opus 4.1 \| Opus 4 \| Sonnet 4
	Sonnet 3.7 \| Sonnet 3.5 \| Haiku 3.5
	Opus 3 \| Sonnet 3 \| Haiku 3
DeepSeek	DeepSeek 3.2 Exp
Qwen	Qwen3-Max \| Qwen-Plus \| Qwen-Flash
	qwen3-235b-a22b-thinking-2507 \| qwen3-235b-a22b-instruct-2507
	qwen3-30b-a3b-thinking-2507 \| qwen3-30b-a3b-instruct-2507
Mistral	Magistral Medium \| Magistral small \| Mistral Medium 3 \| Mistral Small 3.2 \| Mistral Large
Kimi	kimi-k2-thinking \| kimi-k2-0905-preview \| kimi-k2-0711-preview \| kimi-k2-turbo-preview
Z.ai	glm-4.6 \| glm-4.5 \| glm-4.5-air \| glm-4.5-flash
OpenRouter	Claude Sonnet 4.5 \| Gemini 2.5 Flash \| Gemini 2.5 Pro \| Grok 4 Fast \| MiniMax M2 \| Claude Sonnet 4 \| Gemini 2.0 Flash \| DeepSeek V3 0324 \| Gemini 2.5 Flash Lite \| GPT-4o-mini \| Claude Haiku 4.5 \| GLM 4.6 \| Qwen3 235B A22B Instruct 2507 \| gpt-oss-120b \| DeepSeek R1T2 Chimera (free) \| DeepSeek V3.1 \| Gemini 2.5 Flash Preview 09-2025 \| GPT-5 \| GPT-5 Mini \| Claude 3.7 Sonnet \| Tongyi DeepResearch 30B A3B(free) \| gpt-oss-20b(free) \| Mistral Medium 3.1 \| Qwen3 Next 80B A3B Thinking \| Qwen3 Next 80B A3B Instruct \| Claude Opus 4.1 \| Kimi K2 0905 \| Grok 4
SiliconFlow	DeepSeek V3.1 Terminus \| DeepSeek V3.1 \| gpt-oss-120b \| gpt-oss-20b \| Kimi-K2-Instruct-0905 \| Qwen3-Next-80B-A3B-Instruct \| Ling-mini-2.0 \| Ling-flash-2.0 \| DeepSeek-V3 \| DeepSeek-R1 \| GLM-4.5 \| GLM-4.5-Air \| Qwen3-235B-A22B-Thinking-2507 \| Qwen3-235B-A22B-Instruct-2507 \| Qwen3-30B-A3B-Thinking-2507 \| Qwen3-30B-A3B-Instruct-2507 \| Kimi-K2-Instruct \| ERNIE-4.5-300B-A47B \| Hunyuan-A13B-Instruct \| MiniMax-M1-80k

Należy pamiętać, że OpenRouter i SiliconFlow to huby modeli, które udostępniają najpopularniejsze modele SOTA.

Jak ocenić i wybrać model?

Przy tak dużej liczbie modeli dostępnych na rynku, jak wybrać odpowiedni? Oto dwie platformy referencyjne, które warto wziąć pod uwagę:

OpenRouter, który zawiera wiele modeli i jest używany przez dużą liczbę użytkowników. Dlatego warto rozważyć 20 najczęściej używanych modeli wymienionych powyżej. Jednak najlepiej jest je priorytetyzować na podstawie ich przeznaczenia, ponieważ niektóre modele lepiej nadają się do kodowania, ale niekoniecznie do czytania ze zrozumieniem.

lmarena.ai, platforma benchmarków LLM, która ocenia modele wyłącznie na podstawie ręcznej oceny porównawczej, a ocena jest również systemem punktacji typu czarnej skrzynki skonfigurowanym według różnych scenariuszy użycia.

Provider	Supported Models
OpenAI	gpt-5.1 \| gpt-5 \| gpt-5-min \| gpt-5-nano \| gpt-5-chat
	gpt-4.1 \| gpt-4.1-mini \| gpt-4.1-nano
	o4-mini-deep-research \| gpt-4o-mini-search-preview \| gpt-4o-search-preview
	o3 \| o4-mini \| o3-mini \| o1-mini
	gpt-4o \| chatgpt-4o-latest \| gpt-4o-mini \| gpt-4 \| gpt-4-turbo \| gpt-3.5-turbo
Gemini	Gemini 3 Pro Preview
	2.5 Pro \| Flash Latest \| Flash Lite Latest \| 2.5 Flash \| 2.5 Flash-Lite
	2.0 Flash \| 2.0 Flash-Lite
Claude	Haiku 4.5 \| Sonnet 4.5 \| Opus 4.1 \| Opus 4 \| Sonnet 4
	Sonnet 3.7 \| Sonnet 3.5 \| Haiku 3.5
	Opus 3 \| Sonnet 3 \| Haiku 3
DeepSeek	DeepSeek 3.2 Exp
Qwen	Qwen3-Max \| Qwen-Plus \| Qwen-Flash
	qwen3-235b-a22b-thinking-2507 \| qwen3-235b-a22b-instruct-2507
	qwen3-30b-a3b-thinking-2507 \| qwen3-30b-a3b-instruct-2507
Mistral	Magistral Medium \| Magistral small \| Mistral Medium 3 \| Mistral Small 3.2 \| Mistral Large
Kimi	kimi-k2-thinking \| kimi-k2-0905-preview \| kimi-k2-0711-preview \| kimi-k2-turbo-preview
Z.ai	glm-4.6 \| glm-4.5 \| glm-4.5-air \| glm-4.5-flash
OpenRouter	Claude Sonnet 4.5 \| Gemini 2.5 Flash \| Gemini 2.5 Pro \| Grok 4 Fast \| MiniMax M2 \| Claude Sonnet 4 \| Gemini 2.0 Flash \| DeepSeek V3 0324 \| Gemini 2.5 Flash Lite \| GPT-4o-mini \| Claude Haiku 4.5 \| GLM 4.6 \| Qwen3 235B A22B Instruct 2507 \| gpt-oss-120b \| DeepSeek R1T2 Chimera (free) \| DeepSeek V3.1 \| Gemini 2.5 Flash Preview 09-2025 \| GPT-5 \| GPT-5 Mini \| Claude 3.7 Sonnet \| Tongyi DeepResearch 30B A3B(free) \| gpt-oss-20b(free) \| Mistral Medium 3.1 \| Qwen3 Next 80B A3B Thinking \| Qwen3 Next 80B A3B Instruct \| Claude Opus 4.1 \| Kimi K2 0905 \| Grok 4
SiliconFlow	DeepSeek V3.1 Terminus \| DeepSeek V3.1 \| gpt-oss-120b \| gpt-oss-20b \| Kimi-K2-Instruct-0905 \| Qwen3-Next-80B-A3B-Instruct \| Ling-mini-2.0 \| Ling-flash-2.0 \| DeepSeek-V3 \| DeepSeek-R1 \| GLM-4.5 \| GLM-4.5-Air \| Qwen3-235B-A22B-Thinking-2507 \| Qwen3-235B-A22B-Instruct-2507 \| Qwen3-30B-A3B-Thinking-2507 \| Qwen3-30B-A3B-Instruct-2507 \| Kimi-K2-Instruct \| ERNIE-4.5-300B-A47B \| Hunyuan-A13B-Instruct \| MiniMax-M1-80k

Przegląd modeli LLM

Modele LLM online w PapersGPT

Należy pamiętać, że OpenRouter i SiliconFlow to huby modeli, które udostępniają najpopularniejsze modele SOTA.

Jak ocenić i wybrać model?

Przy tak dużej liczbie modeli dostępnych na rynku, jak wybrać odpowiedni? Oto dwie platformy referencyjne, które warto wziąć pod uwagę:

lmarena.ai, platforma benchmarków LLM, która ocenia modele wyłącznie na podstawie ręcznej oceny porównawczej, a ocena jest również systemem punktacji typu czarnej skrzynki skonfigurowanym według różnych scenariuszy użycia.

Ponadto, jeśli często korzystasz z LLM, opłacalny ekonomicznie model jest również punktem wartym rozważenia przy wyborze.