2026 年最便宜的 LLM API 排行榜 — 省錢指南
7 分鐘閱讀LLM Price Compare
AI 應用最大的隱形成本,往往就是 API token 費用。同樣一個任務,選對模型可能省下 10 倍以上的開銷。這篇排行榜依照 llmprice.app 的即時價格,整理出 2026 年 6 月最便宜的 LLM API,並附上各價位的推薦與實用的省錢技巧。
最便宜 LLM API 排行榜(依輸入價格)
以下為各家最具性價比的模型,價格單位為每百萬 tokens(1M)美金。「品質分數」為綜合 benchmark 評分,方便你權衡省錢與能力:
| 模型 | 提供商 | 輸入 / 1M | 輸出 / 1M | 品質 |
|---|---|---|---|---|
| gpt-4o-mini | OpenAI | $0.15 | $0.60 | 80 |
| gpt-5.4-nano | OpenAI | $0.20 | $1.25 | 75 |
| deepseek-chat-v4 | DeepSeek | $0.20 | $0.80 | 88 |
| codestral-latest | Mistral | $0.30 | $0.90 | 80 |
| deepseek-reasoner-v4 | DeepSeek | $0.44 | $0.87 | 92 |
| gemini-2.5-flash | $0.50 | $0.50 | 84 | |
| llama-3.3-70b (Groq) | Groq | $0.59 | $0.79 | 78 |
| gpt-5.4-mini | OpenAI | $0.75 | $4.50 | 85 |
各價位的最佳選擇
極致省錢(每 1M 輸入 < $0.30)
如果你要處理海量請求、預算極度敏感,DeepSeek Chat v4 是目前的甜蜜點:輸入僅 $0.20、輸出 $0.80,卻有 88 的品質分數,遠勝其他同價位模型。OpenAI 的 gpt-4o-mini 與 gpt-5.4-nano 則勝在生態與穩定度,適合輕量聊天與分類任務。
平衡之選(兼顧品質與成本)
想要更聰明又不想多花錢,DeepSeek Reasoner v4(品質 92、輸出僅 $0.87)在推理任務上 CP 值驚人;Gemini 2.5 Flash 則以輸入輸出同價 $0.50、外加超大 Context Window,成為長文件處理的省錢首選。
需要旗艦品質時
若任務真的需要頂尖能力,Claude Sonnet 4.6(輸入 $3 / 輸出 $3.75,品質 90)通常比旗艦的 Opus 或 GPT-5.5 便宜得多,是「夠好又不貴」的務實選擇。
4 個實用的省錢技巧
- 善用 Batch API:OpenAI、Anthropic 等多家對非即時的批次請求提供約 50% 折扣。能容忍幾小時延遲的工作(資料標註、離線分析)一定要用。
- 開啟 Prompt Caching:重複的長 system prompt 或文件可以被快取,命中時輸入成本可降到原本的 1/10。RAG 與 agent 應用收益最大。
- 用小模型分流:先用便宜模型處理簡單請求,只有困難的才升級到旗艦模型(model routing),平均成本能大幅下降。
- 控制輸出長度:輸出 token 通常比輸入貴 2–6 倍。明確要求模型「精簡回答」或設定 max_tokens,省下的就是真金白銀。
結論
2026 年最便宜的 LLM 不再等於「最笨」的模型 —— DeepSeek 等新秀證明了低價也能有高品質。選擇時別只看單一價格,而要結合你的輸入輸出比例與品質需求綜合判斷。把上面的省錢技巧搭配起來,常見可以再砍掉一半以上的帳單。