Przegląd modeli LLM

Modele LLM online w PapersGPT

Obecnie sztuczna inteligencja rozwija się w bardzo szybkim tempie, a nowe modele i techniki pojawiają się niemal co tydzień. Wyścig nie wykazuje oznak spowolnienia, a ranking najlepszych modeli AI zmienia się praktycznie co tydzień. Ten przewodnik pomoże Ci uzyskać ogólny obraz modeli LLM. Większości z nich możesz używać w PapersGPT do czatowania z plikami PDF. Poniżej znajdują się modele obsługiwane w PapersGPT:

ProviderSupported Models
OpenAIgpt-5.1 | gpt-5 | gpt-5-min | gpt-5-nano | gpt-5-chat
gpt-4.1 | gpt-4.1-mini | gpt-4.1-nano
o4-mini-deep-research | gpt-4o-mini-search-preview | gpt-4o-search-preview
o3 | o4-mini | o3-mini | o1-mini
gpt-4o | chatgpt-4o-latest | gpt-4o-mini | gpt-4 | gpt-4-turbo | gpt-3.5-turbo
GeminiGemini 3 Pro Preview
2.5 Pro | Flash Latest | Flash Lite Latest | 2.5 Flash | 2.5 Flash-Lite
2.0 Flash | 2.0 Flash-Lite
ClaudeHaiku 4.5 | Sonnet 4.5 | Opus 4.1 | Opus 4 | Sonnet 4
Sonnet 3.7 | Sonnet 3.5 | Haiku 3.5
Opus 3 | Sonnet 3 | Haiku 3
DeepSeekDeepSeek 3.2 Exp
QwenQwen3-Max | Qwen-Plus | Qwen-Flash
qwen3-235b-a22b-thinking-2507 | qwen3-235b-a22b-instruct-2507
qwen3-30b-a3b-thinking-2507 | qwen3-30b-a3b-instruct-2507
MistralMagistral Medium | Magistral small | Mistral Medium 3 | Mistral Small 3.2 | Mistral Large
Kimikimi-k2-thinking | kimi-k2-0905-preview | kimi-k2-0711-preview | kimi-k2-turbo-preview
Z.aiglm-4.6 | glm-4.5 | glm-4.5-air | glm-4.5-flash
OpenRouterClaude Sonnet 4.5 | Gemini 2.5 Flash | Gemini 2.5 Pro | Grok 4 Fast | MiniMax M2 | Claude Sonnet 4 | Gemini 2.0 Flash | DeepSeek V3 0324 | Gemini 2.5 Flash Lite | GPT-4o-mini | Claude Haiku 4.5 | GLM 4.6 | Qwen3 235B A22B Instruct 2507 | gpt-oss-120b | DeepSeek R1T2 Chimera (free) | DeepSeek V3.1 | Gemini 2.5 Flash Preview 09-2025 | GPT-5 | GPT-5 Mini | Claude 3.7 Sonnet | Tongyi DeepResearch 30B A3B(free) | gpt-oss-20b(free) | Mistral Medium 3.1 | Qwen3 Next 80B A3B Thinking | Qwen3 Next 80B A3B Instruct | Claude Opus 4.1 | Kimi K2 0905 | Grok 4
SiliconFlowDeepSeek V3.1 Terminus | DeepSeek V3.1 | gpt-oss-120b | gpt-oss-20b | Kimi-K2-Instruct-0905 | Qwen3-Next-80B-A3B-Instruct | Ling-mini-2.0 | Ling-flash-2.0 | DeepSeek-V3 | DeepSeek-R1 | GLM-4.5 | GLM-4.5-Air | Qwen3-235B-A22B-Thinking-2507 | Qwen3-235B-A22B-Instruct-2507 | Qwen3-30B-A3B-Thinking-2507 | Qwen3-30B-A3B-Instruct-2507 | Kimi-K2-Instruct | ERNIE-4.5-300B-A47B | Hunyuan-A13B-Instruct | MiniMax-M1-80k

Należy pamiętać, że OpenRouter i SiliconFlow to huby modeli, które udostępniają najpopularniejsze modele SOTA.

Jak ocenić i wybrać model?

Przy tak dużej liczbie modeli dostępnych na rynku, jak wybrać odpowiedni? Oto dwie platformy referencyjne, które warto wziąć pod uwagę:

OpenRouter, który zawiera wiele modeli i jest używany przez dużą liczbę użytkowników. Dlatego warto rozważyć 20 najczęściej używanych modeli wymienionych powyżej. Jednak najlepiej jest je priorytetyzować na podstawie ich przeznaczenia, ponieważ niektóre modele lepiej nadają się do kodowania, ale niekoniecznie do czytania ze zrozumieniem.

lmarena.ai, platforma benchmarków LLM, która ocenia modele wyłącznie na podstawie ręcznej oceny porównawczej, a ocena jest również systemem punktacji typu czarnej skrzynki skonfigurowanym według różnych scenariuszy użycia.

Ponadto, jeśli często korzystasz z LLM, opłacalny ekonomicznie model jest również punktem wartym rozważenia przy wyborze.