مقارنة تسعير نماذج SOTA LLM

استخدام نماذج LLM عبر الإنترنت مع PDF في PapersGPT يتطلب مفتاح API

يدعم PapersGPT تقريبًا جميع نماذج LLM السائدة (نماذج اللغة الكبيرة)، ويجب توفير أو شراء مفتاح API لنماذج LLM بواسطتك. بالنسبة لأي نموذج LLM هو الأنسب لك وأيها أكثر اقتصادًا، إليك بعض المعلومات المرجعية أدناه.

ما هو الرمز (Token)؟

قبل إجراء مقارنة الأسعار، نحتاج أولاً إلى توضيح ما هو الرمز. في مجال الذكاء الاصطناعي ومعالجة اللغة الطبيعية، الرمز هو الوحدة الأساسية بعد تجزئة النص. عدد الأحرف الإنجليزية التي يحتويها الرمز غير ثابت. في اللغة الإنجليزية، الكلمات القصيرة الشائعة مثل "the" و "and" تعد كل منها رمزًا واحدًا، بينما الكلمات الأطول مثل "hesitation" تعد أيضًا رمزًا واحدًا. تقدير تقريبي، قد يقابل الرمز الإنجليزي الواحد في المتوسط ٣-٥ أحرف.

ما هو نموذج SOTA (الأكثر تقدمًا)؟

"نموذج SOTA LLM" هو هدف دائم التغير. لا يوجد نموذج LLM مُعلن عنه عالميًا بأنه 'الأكثر تقدمًا' يمكنه التفوق مطلقًا على جميع النماذج الأخرى في جميع المقاييس. بدلاً من ذلك، يعتمد ما يشكل SOTA إلى حد كبير على المهام المحددة والمعايير ومعايير التقييم. النماذج المختلفة لها نقاط قوة في مجالات مختلفة. ومع ذلك، اعتبارًا من أغسطس ٢٠٢٥، تشمل النماذج الأكثر استخدامًا والمعترف بها على نطاق واسع للذكاء الفائق:

GPT 5 و o1/2/3/4 و GPT 4o (OpenAI): يمكن القول إنه نموذج SOTA الأكثر اعترافًا وتأثيرًا على نطاق واسع. يتفوق في مجموعة واسعة من المهام مثل التفكير والبرمجة والكتابة الإبداعية واتباع التعليمات المعقدة والمعرفة العامة، بقدرات شاملة للغاية.

Gemini (Google): بفضل نظام تطوير المنتجات التقنية القوي من Google ورقاقات الحوسبة الهائلة وكميات كبيرة من البيانات عالية الجودة، اكتسح Gemini Pro 2.5 بسرعة صدارة تصنيفات تقييم النماذج المختلفة. يتطور بسرعة كبيرة، وبأسعار معقولة، ولديه سلسلة من خطط التجربة المجانية، مستحوذًا على حصة سوقية كبيرة.

Claude (Anthropic): نموذج احترافي للغاية، يركز على القابلية العملية الفعلية. في بعض الاستدلالات المعقدة، خاصة في مجال vibe coding، هو الأفضل، وتأثيره يفوق بكثير النماذج الأخرى في السوق.

Grok 4 (xAI): بفضل القوة المالية لأغنى رجل في العالم Elon Musk وقدرته على التأثير والتنفيذ، حققت سلسلة نماذج Grok 4 نجاحًا كبيرًا، واستقرت بشكل أساسي في صدارة تصنيفات تقييم النماذج المختلفة.

الطبقة الثانية الأذكى من نماذج LLM، تقترب من الطبقة الأولى وتتطور بسرعة، تشمل:

DeepSeek: في أوائل عام ٢٠٢٥، مع الإصدار الناجح لـ DeepSeek V3/R1، قفز DeepSeek من الغموض إلى الريادة في مجال تطوير النماذج الكبيرة عالميًا. نقطة بيعه الرئيسية هي نسبة الأداء إلى السعر العالية للغاية، حيث يقدم أداءً قابلاً للمقارنة بأسعار أقل بكثير من المنافسين. نماذجه أيضًا ذكية للغاية، قريبة من المستوى المتطور. بالإضافة إلى ذلك، تسهل نماذجه مفتوحة المصدر بالكامل التخصيص والنشر، مما يقلل بشكل كبير من عتبة تطبيق النماذج الكبيرة.

Mistral: من أوروبا، تشتهر بطابعها متعدد اللغات ومفتوح المصدر. حققت سلسلتها المتوسطة الأخيرة نتائج جيدة جدًا في بعض التقييمات، وتقدم دعمًا فريدًا للغات الأقلية في الدول الأوروبية (مثل الفرنسية والألمانية والإيطالية).

Kimi: kimi-k2 هو نموذج جديد مفتوح المصدر ظهر في يوليو ٢٠٢٥. حقق نتائج جيدة جدًا في سلسلة من التقييمات، خاصة في البرمجة وسيناريوهات استخدام الوكيل، حيث تكون مزاياه أكثر وضوحًا.

هناك العديد من تصنيفات تقييم LLM. نوصي هنا بـ lmarena.ai، الذي يتميز بشكل أساسي بتقييمات بشرية عملية وذاتية نسبيًا كمعيار. في سيناريوهات المحادثة والاستخدام الفعلية، يتم تسجيل نماذج LLM الصندوق الأسود المشاركة في التقييم من قبل البشر.

أي نموذج هو الأكثر فعالية من حيث التكلفة؟

حاليًا، في سيناريوهات قراءة الأوراق، تؤدي معظم نماذج SOTA أو القريبة من SOTA أداءً جيدًا جدًا، ما لم تكن الورقة طويلة جدًا أو تحتوي على الكثير من الرسوم البيانية، إلخ. لذلك، من الضروري جدًا اختيار نموذج LLM بنسبة أداء إلى سعر جيدة. فيما يلي أحدث أسعار API لنماذج SOTA LLM التي جمعتها حتى أغسطس ٢٠٢٥.

ProviderModelInput Token PriceOutput Token Price
OpenAIgpt-5.1$1.25$10.00
gpt-5$1.25$10.00
gpt-5-mini$0.25$2.00
gpt-5-nano$0.05$0.40
gpt-5-chat$1.25$10.00
gpt-4.1$2.00$8.00
gpt-4.1-mini$0.40$1.60
gpt-4.1-nano$0.10$0.40
gpt-4o$2.50$10.00
gpt-4o-mini$0.15$0.60
o4-mini$1.10$4.40
o3-mini$1.10$4.40
o1-mini$1.10$4.40
GeminiGemini 3 Pro Preview$2$12
2.5 Pro$1.25$10
Flash Latest$0.3$2.5
Flash Lite Latest$0.1$0.4
2.5 Flash$0.30$2.5
2.5 Flash-Lite$0.1$0.4
2.0 Flash$0.1$0.4
2.0 Flash-Lite$0.075$0.3
ClaudeSonnet 4.5$3$15
Opus 4.1$15$75
Sonnet 4$3$15
Haiku 3.5$0.8$4
Opus 4$15$75
Opus 3$15$75
Sonnet 3.7$3$15
Haiku 3$0.25$1.25
xAIgrok-4-0709$3$15
DeepSeekChat / Reasoner$0.28$0.42
QwenQwen-Max$1.6$6.4
Qwen-Plus$0.4$1.2
Qwen-Flash$0.05$0.4
qwen3-235b-a22b-thinking-2507$0.7$8.4
qwen3-235b-a22b-instruct-2507$0.7$2.8
qwen3-30b-a3b-thinking-2507$0.2$2.4
qwen3-30b-a3b-instruct-2507$0.2$0.8
MistralMedium 3$0.4$2
Small 3.2$0.1$0.3
Large$2$6
Z.aiGLM 4.6$0.6$2.2
Kimikimi-k2-thinking$0.6$2.5
kimi-k2-0711-preview$0.6$2.5
kimi-k2-turbo-preview$2.4$10

القرار النهائي بين يديك

على الرغم من وجود نماذج LLM مختلفة في السوق، لا داعي للقلق بشأن الاختيار. يعتمد أفضل نموذج LLM والأكثر اقتصادًا على تأثير استخدامه الفعلي. ما عليك سوى اختيار واحد في PapersGPT واستخدامه. إذا شعرت أن التأثير ليس جيدًا أو السعر مرتفع جدًا، يمكنك التبديل إلى نموذج آخر بنقرة واحدة، وهو مريح للغاية.