סקירת LLMs

LLMs מקוונים ב-PapersGPT

כיום, AI מתפתח במהירות מסחררת, עם מודלים וטכנולוגיות חדשים שמופיעים כמעט כל שבוע. מירוץ זה אינו מראה סימני האטה, ודירוגי מודלי ה-AI המובילים משתנים כמעט כל שבוע. מדריך זה יעזור לך לקבל סקירה של LLMs שונים. תוכל להשתמש ברוב ה-LLMs ב-PapersGPT כדי לצ'טט עם PDF. להלן המודלים הנתמכים על ידי PapersGPT:

Provider	Supported Models
OpenAI	gpt-5.1 \| gpt-5 \| gpt-5-min \| gpt-5-nano \| gpt-5-chat
	gpt-4.1 \| gpt-4.1-mini \| gpt-4.1-nano
	o4-mini-deep-research \| gpt-4o-mini-search-preview \| gpt-4o-search-preview
	o3 \| o4-mini \| o3-mini \| o1-mini
	gpt-4o \| chatgpt-4o-latest \| gpt-4o-mini \| gpt-4 \| gpt-4-turbo \| gpt-3.5-turbo
Gemini	Gemini 3 Pro Preview
	2.5 Pro \| Flash Latest \| Flash Lite Latest \| 2.5 Flash \| 2.5 Flash-Lite
	2.0 Flash \| 2.0 Flash-Lite
Claude	Haiku 4.5 \| Sonnet 4.5 \| Opus 4.1 \| Opus 4 \| Sonnet 4
	Sonnet 3.7 \| Sonnet 3.5 \| Haiku 3.5
	Opus 3 \| Sonnet 3 \| Haiku 3
DeepSeek	DeepSeek 3.2 Exp
Qwen	Qwen3-Max \| Qwen-Plus \| Qwen-Flash
	qwen3-235b-a22b-thinking-2507 \| qwen3-235b-a22b-instruct-2507
	qwen3-30b-a3b-thinking-2507 \| qwen3-30b-a3b-instruct-2507
Mistral	Magistral Medium \| Magistral small \| Mistral Medium 3 \| Mistral Small 3.2 \| Mistral Large
Kimi	kimi-k2-thinking \| kimi-k2-0905-preview \| kimi-k2-0711-preview \| kimi-k2-turbo-preview
Z.ai	glm-4.6 \| glm-4.5 \| glm-4.5-air \| glm-4.5-flash
OpenRouter	Claude Sonnet 4.5 \| Gemini 2.5 Flash \| Gemini 2.5 Pro \| Grok 4 Fast \| MiniMax M2 \| Claude Sonnet 4 \| Gemini 2.0 Flash \| DeepSeek V3 0324 \| Gemini 2.5 Flash Lite \| GPT-4o-mini \| Claude Haiku 4.5 \| GLM 4.6 \| Qwen3 235B A22B Instruct 2507 \| gpt-oss-120b \| DeepSeek R1T2 Chimera (free) \| DeepSeek V3.1 \| Gemini 2.5 Flash Preview 09-2025 \| GPT-5 \| GPT-5 Mini \| Claude 3.7 Sonnet \| Tongyi DeepResearch 30B A3B(free) \| gpt-oss-20b(free) \| Mistral Medium 3.1 \| Qwen3 Next 80B A3B Thinking \| Qwen3 Next 80B A3B Instruct \| Claude Opus 4.1 \| Kimi K2 0905 \| Grok 4
SiliconFlow	DeepSeek V3.1 Terminus \| DeepSeek V3.1 \| gpt-oss-120b \| gpt-oss-20b \| Kimi-K2-Instruct-0905 \| Qwen3-Next-80B-A3B-Instruct \| Ling-mini-2.0 \| Ling-flash-2.0 \| DeepSeek-V3 \| DeepSeek-R1 \| GLM-4.5 \| GLM-4.5-Air \| Qwen3-235B-A22B-Thinking-2507 \| Qwen3-235B-A22B-Instruct-2507 \| Qwen3-30B-A3B-Thinking-2507 \| Qwen3-30B-A3B-Instruct-2507 \| Kimi-K2-Instruct \| ERNIE-4.5-300B-A47B \| Hunyuan-A13B-Instruct \| MiniMax-M1-80k

שים לב ש-OpenRouter ו-SiliconFlow הם מרכזי מודלים המספקים את מודלי ה-SOTA הפופולריים ביותר.

איך לשפוט ולבחור את המודל?

עם כל כך הרבה מודלים בשוק, איך לבחור את המתאים? הנה שתי פלטפורמות שתוכל להתייחס אליהן:

OpenRouter, המכיל מודלים רבים ויש לו מספר רב של משתמשים. לכן, 20 המודלים המובילים הנפוצים ביותר הרשומים שם ראויים לשקילה. עם זאת, עדיף לתעדף על בסיס השימוש המיועד, מכיוון שמודלים מסוימים מתאימים יותר לתכנות אך לא בהכרח להבנת הנקרא.

lmarena.ai, פלטפורמת בנצ'מרק LLM, המעריכה מודלים לחלוטין באמצעות השוואות הערכה אנושית, וההערכה היא גם מערכת ניקוד קופסה שחורה המוגדרת על פי תרחישי שימוש שונים.

Provider	Supported Models
OpenAI	gpt-5.1 \| gpt-5 \| gpt-5-min \| gpt-5-nano \| gpt-5-chat
	gpt-4.1 \| gpt-4.1-mini \| gpt-4.1-nano
	o4-mini-deep-research \| gpt-4o-mini-search-preview \| gpt-4o-search-preview
	o3 \| o4-mini \| o3-mini \| o1-mini
	gpt-4o \| chatgpt-4o-latest \| gpt-4o-mini \| gpt-4 \| gpt-4-turbo \| gpt-3.5-turbo
Gemini	Gemini 3 Pro Preview
	2.5 Pro \| Flash Latest \| Flash Lite Latest \| 2.5 Flash \| 2.5 Flash-Lite
	2.0 Flash \| 2.0 Flash-Lite
Claude	Haiku 4.5 \| Sonnet 4.5 \| Opus 4.1 \| Opus 4 \| Sonnet 4
	Sonnet 3.7 \| Sonnet 3.5 \| Haiku 3.5
	Opus 3 \| Sonnet 3 \| Haiku 3
DeepSeek	DeepSeek 3.2 Exp
Qwen	Qwen3-Max \| Qwen-Plus \| Qwen-Flash
	qwen3-235b-a22b-thinking-2507 \| qwen3-235b-a22b-instruct-2507
	qwen3-30b-a3b-thinking-2507 \| qwen3-30b-a3b-instruct-2507
Mistral	Magistral Medium \| Magistral small \| Mistral Medium 3 \| Mistral Small 3.2 \| Mistral Large
Kimi	kimi-k2-thinking \| kimi-k2-0905-preview \| kimi-k2-0711-preview \| kimi-k2-turbo-preview
Z.ai	glm-4.6 \| glm-4.5 \| glm-4.5-air \| glm-4.5-flash
OpenRouter	Claude Sonnet 4.5 \| Gemini 2.5 Flash \| Gemini 2.5 Pro \| Grok 4 Fast \| MiniMax M2 \| Claude Sonnet 4 \| Gemini 2.0 Flash \| DeepSeek V3 0324 \| Gemini 2.5 Flash Lite \| GPT-4o-mini \| Claude Haiku 4.5 \| GLM 4.6 \| Qwen3 235B A22B Instruct 2507 \| gpt-oss-120b \| DeepSeek R1T2 Chimera (free) \| DeepSeek V3.1 \| Gemini 2.5 Flash Preview 09-2025 \| GPT-5 \| GPT-5 Mini \| Claude 3.7 Sonnet \| Tongyi DeepResearch 30B A3B(free) \| gpt-oss-20b(free) \| Mistral Medium 3.1 \| Qwen3 Next 80B A3B Thinking \| Qwen3 Next 80B A3B Instruct \| Claude Opus 4.1 \| Kimi K2 0905 \| Grok 4
SiliconFlow	DeepSeek V3.1 Terminus \| DeepSeek V3.1 \| gpt-oss-120b \| gpt-oss-20b \| Kimi-K2-Instruct-0905 \| Qwen3-Next-80B-A3B-Instruct \| Ling-mini-2.0 \| Ling-flash-2.0 \| DeepSeek-V3 \| DeepSeek-R1 \| GLM-4.5 \| GLM-4.5-Air \| Qwen3-235B-A22B-Thinking-2507 \| Qwen3-235B-A22B-Instruct-2507 \| Qwen3-30B-A3B-Thinking-2507 \| Qwen3-30B-A3B-Instruct-2507 \| Kimi-K2-Instruct \| ERNIE-4.5-300B-A47B \| Hunyuan-A13B-Instruct \| MiniMax-M1-80k

סקירת LLMs

LLMs מקוונים ב-PapersGPT

שים לב ש-OpenRouter ו-SiliconFlow הם מרכזי מודלים המספקים את מודלי ה-SOTA הפופולריים ביותר.

איך לשפוט ולבחור את המודל?

עם כל כך הרבה מודלים בשוק, איך לבחור את המתאים? הנה שתי פלטפורמות שתוכל להתייחס אליהן:

lmarena.ai, פלטפורמת בנצ'מרק LLM, המעריכה מודלים לחלוטין באמצעות השוואות הערכה אנושית, וההערכה היא גם מערכת ניקוד קופסה שחורה המוגדרת על פי תרחישי שימוש שונים.

בנוסף, אם אתה משתמש לעתים קרובות ב-LLMs, מודל חסכוני הוא גם גורם ששווה לשקול בבחירה.