סקירת LLMs

LLMs מקוונים ב-PapersGPT

כיום, AI מתפתח במהירות מסחררת, עם מודלים וטכנולוגיות חדשים שמופיעים כמעט כל שבוע. מירוץ זה אינו מראה סימני האטה, ודירוגי מודלי ה-AI המובילים משתנים כמעט כל שבוע. מדריך זה יעזור לך לקבל סקירה של LLMs שונים. תוכל להשתמש ברוב ה-LLMs ב-PapersGPT כדי לצ'טט עם PDF. להלן המודלים הנתמכים על ידי PapersGPT:

ProviderSupported Models
OpenAIgpt-5.1 | gpt-5 | gpt-5-min | gpt-5-nano | gpt-5-chat
gpt-4.1 | gpt-4.1-mini | gpt-4.1-nano
o4-mini-deep-research | gpt-4o-mini-search-preview | gpt-4o-search-preview
o3 | o4-mini | o3-mini | o1-mini
gpt-4o | chatgpt-4o-latest | gpt-4o-mini | gpt-4 | gpt-4-turbo | gpt-3.5-turbo
GeminiGemini 3 Pro Preview
2.5 Pro | Flash Latest | Flash Lite Latest | 2.5 Flash | 2.5 Flash-Lite
2.0 Flash | 2.0 Flash-Lite
ClaudeHaiku 4.5 | Sonnet 4.5 | Opus 4.1 | Opus 4 | Sonnet 4
Sonnet 3.7 | Sonnet 3.5 | Haiku 3.5
Opus 3 | Sonnet 3 | Haiku 3
DeepSeekDeepSeek 3.2 Exp
QwenQwen3-Max | Qwen-Plus | Qwen-Flash
qwen3-235b-a22b-thinking-2507 | qwen3-235b-a22b-instruct-2507
qwen3-30b-a3b-thinking-2507 | qwen3-30b-a3b-instruct-2507
MistralMagistral Medium | Magistral small | Mistral Medium 3 | Mistral Small 3.2 | Mistral Large
Kimikimi-k2-thinking | kimi-k2-0905-preview | kimi-k2-0711-preview | kimi-k2-turbo-preview
Z.aiglm-4.6 | glm-4.5 | glm-4.5-air | glm-4.5-flash
OpenRouterClaude Sonnet 4.5 | Gemini 2.5 Flash | Gemini 2.5 Pro | Grok 4 Fast | MiniMax M2 | Claude Sonnet 4 | Gemini 2.0 Flash | DeepSeek V3 0324 | Gemini 2.5 Flash Lite | GPT-4o-mini | Claude Haiku 4.5 | GLM 4.6 | Qwen3 235B A22B Instruct 2507 | gpt-oss-120b | DeepSeek R1T2 Chimera (free) | DeepSeek V3.1 | Gemini 2.5 Flash Preview 09-2025 | GPT-5 | GPT-5 Mini | Claude 3.7 Sonnet | Tongyi DeepResearch 30B A3B(free) | gpt-oss-20b(free) | Mistral Medium 3.1 | Qwen3 Next 80B A3B Thinking | Qwen3 Next 80B A3B Instruct | Claude Opus 4.1 | Kimi K2 0905 | Grok 4
SiliconFlowDeepSeek V3.1 Terminus | DeepSeek V3.1 | gpt-oss-120b | gpt-oss-20b | Kimi-K2-Instruct-0905 | Qwen3-Next-80B-A3B-Instruct | Ling-mini-2.0 | Ling-flash-2.0 | DeepSeek-V3 | DeepSeek-R1 | GLM-4.5 | GLM-4.5-Air | Qwen3-235B-A22B-Thinking-2507 | Qwen3-235B-A22B-Instruct-2507 | Qwen3-30B-A3B-Thinking-2507 | Qwen3-30B-A3B-Instruct-2507 | Kimi-K2-Instruct | ERNIE-4.5-300B-A47B | Hunyuan-A13B-Instruct | MiniMax-M1-80k

שים לב ש-OpenRouter ו-SiliconFlow הם מרכזי מודלים המספקים את מודלי ה-SOTA הפופולריים ביותר.

איך לשפוט ולבחור את המודל?

עם כל כך הרבה מודלים בשוק, איך לבחור את המתאים? הנה שתי פלטפורמות שתוכל להתייחס אליהן:

OpenRouter, המכיל מודלים רבים ויש לו מספר רב של משתמשים. לכן, 20 המודלים המובילים הנפוצים ביותר הרשומים שם ראויים לשקילה. עם זאת, עדיף לתעדף על בסיס השימוש המיועד, מכיוון שמודלים מסוימים מתאימים יותר לתכנות אך לא בהכרח להבנת הנקרא.

lmarena.ai, פלטפורמת בנצ'מרק LLM, המעריכה מודלים לחלוטין באמצעות השוואות הערכה אנושית, וההערכה היא גם מערכת ניקוד קופסה שחורה המוגדרת על פי תרחישי שימוש שונים.

בנוסף, אם אתה משתמש לעתים קרובות ב-LLMs, מודל חסכוני הוא גם גורם ששווה לשקול בבחירה.