SOTA LLM 가격 비교
PapersGPT에서 온라인 LLM으로 PDF와 채팅하려면 API KEY가 필요합니다
PapersGPT에서는 거의 모든 주류 LLM(대규모 언어 모델)이 지원되며, LLM API KEY는 직접 제공하거나 구매해야 합니다. 어떤 LLM이 가장 적합하고 어떤 것이 가장 비용 효율적인지에 대한 참고 정보를 아래에 제시합니다.
토큰이란?
가격 비교를 하기 전에 먼저 토큰이 무엇인지 이해해야 합니다. 인공지능 및 자연어 처리 분야에서 토큰은 텍스트 분할 후의 기본 단위입니다. 하나의 토큰에 포함된 영어 단어의 수는 고정되어 있지 않습니다. 영어에서 "the" "and"와 같은 일반적인 짧은 단어는 하나의 토큰이고, "hesitation"과 같은 긴 단어도 하나의 토큰입니다. 대략적인 추정으로, 평균적으로 하나의 영어 토큰은 3-5개의 문자에 해당할 수 있습니다.
SOTA(최첨단) 모델이란?
"SOTA LLM 모델"은 끊임없이 움직이는 목표입니다. 그리고 모든 단일 메트릭에서 다른 모든 것을 결정적으로 능가하는 단일하고 보편적으로 선언된 "SOTA"(최첨단) LLM은 존재하지 않습니다. 대신 SOTA로 간주되는 것은 특정 작업, 벤치마크 및 평가 기준에 크게 의존합니다. 서로 다른 모델이 서로 다른 영역에서 뛰어납니다. 하지만 2025년 8월까지 가장 널리 사용되고 인정받는 최상위 스마트 모델에는 다음이 포함됩니다:
GPT 5, o1/2/3/4, GPT 4o(OpenAI): 이것은 아마도 가장 널리 인정받고 영향력 있는 SOTA 모델일 것입니다. 추론, 코딩, 창의적 글쓰기, 복잡한 지시 따르기, 일반 지식 등 광범위한 작업에서 뛰어납니다. 그 능력은 방대합니다.
Gemini(Google): Google의 강력한 기술 제품 개발 시스템, 대규모 컴퓨팅 칩, 방대한 양의 고품질 데이터를 활용하여 Gemini Pro 2.5는 주요 모델 평가 순위의 정상을 빠르게 휩쓸었습니다. 매우 빠르게 발전했고, 매우 저렴했으며, 일련의 무료 체험 계획을 제공하여 큰 시장 점유율을 확보했습니다.
Claude(Anthropic): 실용적인 사용성을 강조하는 매우 전문적인 모델입니다. 일부 복잡한 추론, 특히 바이브 코딩 분야에서 최고이며 그 효과는 시장의 다른 모델을 훨씬 능가합니다.
Grok 4(xAI): 세계 최고 부자인 일론 머스크의 재정적 자원, 강력한 호소력과 실행력 덕분에 Grok 4 시리즈 모델은 큰 성공을 거두었으며, 기본적으로 주요 모델 리뷰 순위의 최상위에 있습니다.
1계층에 접근하며 빠르게 발전하는 가장 스마트한 2계층 LLM에는 다음이 포함됩니다:
DeepSeek: 2025년 초, DeepSeek V3/R1의 성공적인 출시 덕분에 DeepSeek은 무명에서 대규모 모델 개발의 글로벌 리더로 도약했습니다. 주요 판매 포인트는 비용 효율성으로, 동등한 성능에 대해 경쟁 제품보다 현저히 낮은 가격입니다. 그 모델은 또한 매우 지능적이며 최첨단 성능에 접근합니다. 또한 완전히 오픈소스 모델이므로 쉽게 사용자 정의하고 배포할 수 있어 대규모 모델 도입의 진입 장벽을 크게 낮춥니다.
Mistral: 유럽 출신으로, 다국어성과 오픈소스 특성으로 유명합니다. 최신 Medium 시리즈는 일부 리뷰에서 매우 좋은 결과를 달성했으며, 프랑스어, 독일어, 이탈리아어와 같은 유럽 국가의 소수 언어에 대한 독특한 지원을 제공합니다.
Kimi: kimi-k2는 2025년 7월에 등장한 새로운 오픈소스 모델입니다. 일련의 평가에서 매우 좋은 결과를 달성했으며, 특히 코딩 및 에이전트 사용 시나리오에서 그 이점이 더욱 분명합니다.
LLM에 대한 평가 순위는 많이 있습니다. 여기서는 lmarena.ai를 추천합니다. 주요 특징은 실제적이고 상대적으로 주관적인 수동 평가를 기준으로 사용하는 것입니다. 실제 대화 및 사용 시나리오에서 인간이 참여하는 블랙박스 LLM을 수동으로 점수를 매깁니다.
가장 비용 효율적인 모델은 무엇인가요?
현재 논문 읽기 시나리오에서는 논문이 매우 길거나 많은 수의 차트를 포함하지 않는 한 대부분의 SOTA 또는 SOTA에 가까운 모델이 매우 잘 작동합니다. 따라서 비용 효율성이 좋은 LLM을 선택하는 것이 매우 필요합니다. 아래는 2025년 8월까지 제가 수집한 최신 SOTA LLM API 가격입니다.
| Provider | Model | Input Token Price | Output Token Price |
|---|---|---|---|
| OpenAI | gpt-5.1 | $1.25 | $10.00 |
| gpt-5 | $1.25 | $10.00 | |
| gpt-5-mini | $0.25 | $2.00 | |
| gpt-5-nano | $0.05 | $0.40 | |
| gpt-5-chat | $1.25 | $10.00 | |
| gpt-4.1 | $2.00 | $8.00 | |
| gpt-4.1-mini | $0.40 | $1.60 | |
| gpt-4.1-nano | $0.10 | $0.40 | |
| gpt-4o | $2.50 | $10.00 | |
| gpt-4o-mini | $0.15 | $0.60 | |
| o4-mini | $1.10 | $4.40 | |
| o3-mini | $1.10 | $4.40 | |
| o1-mini | $1.10 | $4.40 | |
| Gemini | Gemini 3 Pro Preview | $2 | $12 |
| 2.5 Pro | $1.25 | $10 | |
| Flash Latest | $0.3 | $2.5 | |
| Flash Lite Latest | $0.1 | $0.4 | |
| 2.5 Flash | $0.30 | $2.5 | |
| 2.5 Flash-Lite | $0.1 | $0.4 | |
| 2.0 Flash | $0.1 | $0.4 | |
| 2.0 Flash-Lite | $0.075 | $0.3 | |
| Claude | Sonnet 4.5 | $3 | $15 |
| Opus 4.1 | $15 | $75 | |
| Sonnet 4 | $3 | $15 | |
| Haiku 3.5 | $0.8 | $4 | |
| Opus 4 | $15 | $75 | |
| Opus 3 | $15 | $75 | |
| Sonnet 3.7 | $3 | $15 | |
| Haiku 3 | $0.25 | $1.25 | |
| xAI | grok-4-0709 | $3 | $15 |
| DeepSeek | Chat / Reasoner | $0.28 | $0.42 |
| Qwen | Qwen-Max | $1.6 | $6.4 |
| Qwen-Plus | $0.4 | $1.2 | |
| Qwen-Flash | $0.05 | $0.4 | |
| qwen3-235b-a22b-thinking-2507 | $0.7 | $8.4 | |
| qwen3-235b-a22b-instruct-2507 | $0.7 | $2.8 | |
| qwen3-30b-a3b-thinking-2507 | $0.2 | $2.4 | |
| qwen3-30b-a3b-instruct-2507 | $0.2 | $0.8 | |
| Mistral | Medium 3 | $0.4 | $2 |
| Small 3.2 | $0.1 | $0.3 | |
| Large | $2 | $6 | |
| Z.ai | GLM 4.6 | $0.6 | $2.2 |
| Kimi | kimi-k2-thinking | $0.6 | $2.5 |
| kimi-k2-0711-preview | $0.6 | $2.5 | |
| kimi-k2-turbo-preview | $2.4 | $10 |
