مقارنة تسعير نماذج SOTA LLM
استخدام نماذج LLM عبر الإنترنت مع PDF في PapersGPT يتطلب مفتاح API
يدعم PapersGPT تقريبًا جميع نماذج LLM السائدة (نماذج اللغة الكبيرة)، ويجب توفير أو شراء مفتاح API لنماذج LLM بواسطتك. بالنسبة لأي نموذج LLM هو الأنسب لك وأيها أكثر اقتصادًا، إليك بعض المعلومات المرجعية أدناه.
ما هو الرمز (Token)؟
قبل إجراء مقارنة الأسعار، نحتاج أولاً إلى توضيح ما هو الرمز. في مجال الذكاء الاصطناعي ومعالجة اللغة الطبيعية، الرمز هو الوحدة الأساسية بعد تجزئة النص. عدد الأحرف الإنجليزية التي يحتويها الرمز غير ثابت. في اللغة الإنجليزية، الكلمات القصيرة الشائعة مثل "the" و "and" تعد كل منها رمزًا واحدًا، بينما الكلمات الأطول مثل "hesitation" تعد أيضًا رمزًا واحدًا. تقدير تقريبي، قد يقابل الرمز الإنجليزي الواحد في المتوسط ٣-٥ أحرف.
ما هو نموذج SOTA (الأكثر تقدمًا)؟
"نموذج SOTA LLM" هو هدف دائم التغير. لا يوجد نموذج LLM مُعلن عنه عالميًا بأنه 'الأكثر تقدمًا' يمكنه التفوق مطلقًا على جميع النماذج الأخرى في جميع المقاييس. بدلاً من ذلك، يعتمد ما يشكل SOTA إلى حد كبير على المهام المحددة والمعايير ومعايير التقييم. النماذج المختلفة لها نقاط قوة في مجالات مختلفة. ومع ذلك، اعتبارًا من أغسطس ٢٠٢٥، تشمل النماذج الأكثر استخدامًا والمعترف بها على نطاق واسع للذكاء الفائق:
GPT 5 و o1/2/3/4 و GPT 4o (OpenAI): يمكن القول إنه نموذج SOTA الأكثر اعترافًا وتأثيرًا على نطاق واسع. يتفوق في مجموعة واسعة من المهام مثل التفكير والبرمجة والكتابة الإبداعية واتباع التعليمات المعقدة والمعرفة العامة، بقدرات شاملة للغاية.
Gemini (Google): بفضل نظام تطوير المنتجات التقنية القوي من Google ورقاقات الحوسبة الهائلة وكميات كبيرة من البيانات عالية الجودة، اكتسح Gemini Pro 2.5 بسرعة صدارة تصنيفات تقييم النماذج المختلفة. يتطور بسرعة كبيرة، وبأسعار معقولة، ولديه سلسلة من خطط التجربة المجانية، مستحوذًا على حصة سوقية كبيرة.
Claude (Anthropic): نموذج احترافي للغاية، يركز على القابلية العملية الفعلية. في بعض الاستدلالات المعقدة، خاصة في مجال vibe coding، هو الأفضل، وتأثيره يفوق بكثير النماذج الأخرى في السوق.
Grok 4 (xAI): بفضل القوة المالية لأغنى رجل في العالم Elon Musk وقدرته على التأثير والتنفيذ، حققت سلسلة نماذج Grok 4 نجاحًا كبيرًا، واستقرت بشكل أساسي في صدارة تصنيفات تقييم النماذج المختلفة.
الطبقة الثانية الأذكى من نماذج LLM، تقترب من الطبقة الأولى وتتطور بسرعة، تشمل:
DeepSeek: في أوائل عام ٢٠٢٥، مع الإصدار الناجح لـ DeepSeek V3/R1، قفز DeepSeek من الغموض إلى الريادة في مجال تطوير النماذج الكبيرة عالميًا. نقطة بيعه الرئيسية هي نسبة الأداء إلى السعر العالية للغاية، حيث يقدم أداءً قابلاً للمقارنة بأسعار أقل بكثير من المنافسين. نماذجه أيضًا ذكية للغاية، قريبة من المستوى المتطور. بالإضافة إلى ذلك، تسهل نماذجه مفتوحة المصدر بالكامل التخصيص والنشر، مما يقلل بشكل كبير من عتبة تطبيق النماذج الكبيرة.
Mistral: من أوروبا، تشتهر بطابعها متعدد اللغات ومفتوح المصدر. حققت سلسلتها المتوسطة الأخيرة نتائج جيدة جدًا في بعض التقييمات، وتقدم دعمًا فريدًا للغات الأقلية في الدول الأوروبية (مثل الفرنسية والألمانية والإيطالية).
Kimi: kimi-k2 هو نموذج جديد مفتوح المصدر ظهر في يوليو ٢٠٢٥. حقق نتائج جيدة جدًا في سلسلة من التقييمات، خاصة في البرمجة وسيناريوهات استخدام الوكيل، حيث تكون مزاياه أكثر وضوحًا.
هناك العديد من تصنيفات تقييم LLM. نوصي هنا بـ lmarena.ai، الذي يتميز بشكل أساسي بتقييمات بشرية عملية وذاتية نسبيًا كمعيار. في سيناريوهات المحادثة والاستخدام الفعلية، يتم تسجيل نماذج LLM الصندوق الأسود المشاركة في التقييم من قبل البشر.
أي نموذج هو الأكثر فعالية من حيث التكلفة؟
حاليًا، في سيناريوهات قراءة الأوراق، تؤدي معظم نماذج SOTA أو القريبة من SOTA أداءً جيدًا جدًا، ما لم تكن الورقة طويلة جدًا أو تحتوي على الكثير من الرسوم البيانية، إلخ. لذلك، من الضروري جدًا اختيار نموذج LLM بنسبة أداء إلى سعر جيدة. فيما يلي أحدث أسعار API لنماذج SOTA LLM التي جمعتها حتى أغسطس ٢٠٢٥.
| Provider | Model | Input Token Price | Output Token Price |
|---|---|---|---|
| OpenAI | gpt-5.1 | $1.25 | $10.00 |
| gpt-5 | $1.25 | $10.00 | |
| gpt-5-mini | $0.25 | $2.00 | |
| gpt-5-nano | $0.05 | $0.40 | |
| gpt-5-chat | $1.25 | $10.00 | |
| gpt-4.1 | $2.00 | $8.00 | |
| gpt-4.1-mini | $0.40 | $1.60 | |
| gpt-4.1-nano | $0.10 | $0.40 | |
| gpt-4o | $2.50 | $10.00 | |
| gpt-4o-mini | $0.15 | $0.60 | |
| o4-mini | $1.10 | $4.40 | |
| o3-mini | $1.10 | $4.40 | |
| o1-mini | $1.10 | $4.40 | |
| Gemini | Gemini 3 Pro Preview | $2 | $12 |
| 2.5 Pro | $1.25 | $10 | |
| Flash Latest | $0.3 | $2.5 | |
| Flash Lite Latest | $0.1 | $0.4 | |
| 2.5 Flash | $0.30 | $2.5 | |
| 2.5 Flash-Lite | $0.1 | $0.4 | |
| 2.0 Flash | $0.1 | $0.4 | |
| 2.0 Flash-Lite | $0.075 | $0.3 | |
| Claude | Sonnet 4.5 | $3 | $15 |
| Opus 4.1 | $15 | $75 | |
| Sonnet 4 | $3 | $15 | |
| Haiku 3.5 | $0.8 | $4 | |
| Opus 4 | $15 | $75 | |
| Opus 3 | $15 | $75 | |
| Sonnet 3.7 | $3 | $15 | |
| Haiku 3 | $0.25 | $1.25 | |
| xAI | grok-4-0709 | $3 | $15 |
| DeepSeek | Chat / Reasoner | $0.28 | $0.42 |
| Qwen | Qwen-Max | $1.6 | $6.4 |
| Qwen-Plus | $0.4 | $1.2 | |
| Qwen-Flash | $0.05 | $0.4 | |
| qwen3-235b-a22b-thinking-2507 | $0.7 | $8.4 | |
| qwen3-235b-a22b-instruct-2507 | $0.7 | $2.8 | |
| qwen3-30b-a3b-thinking-2507 | $0.2 | $2.4 | |
| qwen3-30b-a3b-instruct-2507 | $0.2 | $0.8 | |
| Mistral | Medium 3 | $0.4 | $2 |
| Small 3.2 | $0.1 | $0.3 | |
| Large | $2 | $6 | |
| Z.ai | GLM 4.6 | $0.6 | $2.2 |
| Kimi | kimi-k2-thinking | $0.6 | $2.5 |
| kimi-k2-0711-preview | $0.6 | $2.5 | |
| kimi-k2-turbo-preview | $2.4 | $10 |
