SOTA LLM料金比較
PapersGPTでオンラインLLMを使ってPDFとチャットするにはAPI KEYが必要です
PapersGPTではほぼすべての主流LLM(大規模言語モデル)がサポートされており、LLM API KEYは自分で用意または購入する必要があります。どのLLMが最も適していて、どれが最もコスト効率が良いかについて、以下に参考情報を示します。
トークンとは?
料金比較を行う前に、まずトークンとは何かを理解する必要があります。人工知能と自然言語処理の分野では、トークンはテキストを分割した後の基本単位です。1つのトークンに含まれる英単語の数は固定されていません。英語では、"the" "and"のような一般的な短い単語は1トークンであり、"hesitation"のような長い単語も1トークンです。大まかな見積もりとして、平均して1つの英語トークンは3〜5文字に対応する可能性があります。
SOTA(最先端)モデルとは?
"SOTA LLMモデル"は常に変化するターゲットです。そして、すべての指標において他のすべてを決定的に上回る、単一の普遍的に宣言された"SOTA"(最先端)LLMは存在しません。代わりに、SOTAと見なされるものは、特定のタスク、ベンチマーク、評価基準に大きく依存します。異なるモデルが異なる分野で優れています。しかし、2025年8月まで、最も広く使用され認識されているトップクラスのスマートモデルには以下が含まれます:
GPT 5、o1/2/3/4、GPT 4o(OpenAI):これはおそらく最も広く認識され影響力のあるSOTAモデルです。推論、コーディング、創造的な文章作成、複雑な指示の遵守、一般的な知識など、幅広いタスクで優れています。その能力は広大です。
Gemini(Google):Googleの強力なテクノロジー製品開発システム、大規模なコンピューティングチップ、大量の高品質データを活用して、Gemini Pro 2.5は主要なモデル評価ランキングのトップを急速に席巻しました。非常に急速に発展し、非常に手頃な価格で、一連の無料トライアルプランを提供し、大きな市場シェアを獲得しました。
Claude(Anthropic):実用的な使いやすさを重視した非常に専門的なモデルです。一部の複雑な推論、特にバイブコーディングの分野では最高であり、その効果は市場の他のモデルをはるかに上回っています。
Grok 4(xAI):世界で最も裕福な人物であるイーロン・マスクの財力、強力な魅力、実行力のおかげで、Grok 4シリーズのモデルは大成功を収め、基本的に主要なモデルレビューのランキングでトップに位置しています。
最もスマートな第二層のLLMで、第一層に近づき急速に発展しているものには以下が含まれます:
DeepSeek:2025年初頭、DeepSeek V3/R1の成功した立ち上げのおかげで、DeepSeekは無名から大規模モデル開発のグローバルリーダーに躍り出ました。その主なセールスポイントはコスト効率であり、同等のパフォーマンスに対して競合製品よりも大幅に低価格です。そのモデルも非常にインテリジェントで、最先端のパフォーマンスに近づいています。さらに、完全にオープンソースのモデルにより、簡単なカスタマイズと展開が可能で、大規模モデル採用の参入障壁を大幅に下げています。
Mistral:ヨーロッパ発祥で、多言語性とオープンソースの性質で知られています。最新のMediumシリーズは一部のレビューで非常に良い結果を達成しており、フランス語、ドイツ語、イタリア語などヨーロッパ諸国の少数言語に対して独自のサポートを提供しています。
Kimi:kimi-k2は2025年7月に登場した新しいオープンソースモデルです。一連の評価で非常に良い結果を達成しており、特にコーディングとエージェントの使用シナリオにおいて、その優位性がより顕著です。
LLMの評価ランキングは多数あります。ここではlmarena.aiをお勧めします。その主な特徴は、実際の比較的主観的な手動評価を基準として使用することです。実際の会話や使用シナリオにおいて、人間が参加するブラックボックスLLMを手動で採点します。
最もコスト効率の良いモデルはどれですか?
現在、論文読解のシナリオでは、論文が非常に長いか大量の図表を含む場合を除き、ほとんどのSOTAまたはSOTAに近いモデルが非常に良好に機能します。したがって、コスト効率の良いLLMを選択することが非常に必要です。以下は2025年8月までにまとめた最新のSOTA LLM API料金です。
| Provider | Model | Input Token Price | Output Token Price |
|---|---|---|---|
| OpenAI | gpt-5.1 | $1.25 | $10.00 |
| gpt-5 | $1.25 | $10.00 | |
| gpt-5-mini | $0.25 | $2.00 | |
| gpt-5-nano | $0.05 | $0.40 | |
| gpt-5-chat | $1.25 | $10.00 | |
| gpt-4.1 | $2.00 | $8.00 | |
| gpt-4.1-mini | $0.40 | $1.60 | |
| gpt-4.1-nano | $0.10 | $0.40 | |
| gpt-4o | $2.50 | $10.00 | |
| gpt-4o-mini | $0.15 | $0.60 | |
| o4-mini | $1.10 | $4.40 | |
| o3-mini | $1.10 | $4.40 | |
| o1-mini | $1.10 | $4.40 | |
| Gemini | Gemini 3 Pro Preview | $2 | $12 |
| 2.5 Pro | $1.25 | $10 | |
| Flash Latest | $0.3 | $2.5 | |
| Flash Lite Latest | $0.1 | $0.4 | |
| 2.5 Flash | $0.30 | $2.5 | |
| 2.5 Flash-Lite | $0.1 | $0.4 | |
| 2.0 Flash | $0.1 | $0.4 | |
| 2.0 Flash-Lite | $0.075 | $0.3 | |
| Claude | Sonnet 4.5 | $3 | $15 |
| Opus 4.1 | $15 | $75 | |
| Sonnet 4 | $3 | $15 | |
| Haiku 3.5 | $0.8 | $4 | |
| Opus 4 | $15 | $75 | |
| Opus 3 | $15 | $75 | |
| Sonnet 3.7 | $3 | $15 | |
| Haiku 3 | $0.25 | $1.25 | |
| xAI | grok-4-0709 | $3 | $15 |
| DeepSeek | Chat / Reasoner | $0.28 | $0.42 |
| Qwen | Qwen-Max | $1.6 | $6.4 |
| Qwen-Plus | $0.4 | $1.2 | |
| Qwen-Flash | $0.05 | $0.4 | |
| qwen3-235b-a22b-thinking-2507 | $0.7 | $8.4 | |
| qwen3-235b-a22b-instruct-2507 | $0.7 | $2.8 | |
| qwen3-30b-a3b-thinking-2507 | $0.2 | $2.4 | |
| qwen3-30b-a3b-instruct-2507 | $0.2 | $0.8 | |
| Mistral | Medium 3 | $0.4 | $2 |
| Small 3.2 | $0.1 | $0.3 | |
| Large | $2 | $6 | |
| Z.ai | GLM 4.6 | $0.6 | $2.2 |
| Kimi | kimi-k2-thinking | $0.6 | $2.5 |
| kimi-k2-0711-preview | $0.6 | $2.5 | |
| kimi-k2-turbo-preview | $2.4 | $10 |
