LLM InsightsEnglish
回到所有文章

2026 年最便宜的 LLM API 排行榜 — 省錢指南

7 分鐘閱讀LLM Price Compare

AI 應用最大的隱形成本,往往就是 API token 費用。同樣一個任務,選對模型可能省下 10 倍以上的開銷。這篇排行榜依照 llmprice.app 的即時價格,整理出 2026 年 6 月最便宜的 LLM API,並附上各價位的推薦與實用的省錢技巧。

最便宜 LLM API 排行榜(依輸入價格)

以下為各家最具性價比的模型,價格單位為每百萬 tokens(1M)美金。「品質分數」為綜合 benchmark 評分,方便你權衡省錢與能力:

模型提供商輸入 / 1M輸出 / 1M品質
gpt-4o-miniOpenAI$0.15$0.6080
gpt-5.4-nanoOpenAI$0.20$1.2575
deepseek-chat-v4DeepSeek$0.20$0.8088
codestral-latestMistral$0.30$0.9080
deepseek-reasoner-v4DeepSeek$0.44$0.8792
gemini-2.5-flashGoogle$0.50$0.5084
llama-3.3-70b (Groq)Groq$0.59$0.7978
gpt-5.4-miniOpenAI$0.75$4.5085
數據來源:llmprice.app,2026 年 6 月最新官方價格

各價位的最佳選擇

極致省錢(每 1M 輸入 < $0.30)

如果你要處理海量請求、預算極度敏感,DeepSeek Chat v4 是目前的甜蜜點:輸入僅 $0.20、輸出 $0.80,卻有 88 的品質分數,遠勝其他同價位模型。OpenAI 的 gpt-4o-minigpt-5.4-nano 則勝在生態與穩定度,適合輕量聊天與分類任務。

平衡之選(兼顧品質與成本)

想要更聰明又不想多花錢,DeepSeek Reasoner v4(品質 92、輸出僅 $0.87)在推理任務上 CP 值驚人;Gemini 2.5 Flash 則以輸入輸出同價 $0.50、外加超大 Context Window,成為長文件處理的省錢首選。

需要旗艦品質時

若任務真的需要頂尖能力,Claude Sonnet 4.6(輸入 $3 / 輸出 $3.75,品質 90)通常比旗艦的 Opus 或 GPT-5.5 便宜得多,是「夠好又不貴」的務實選擇。

4 個實用的省錢技巧

  1. 善用 Batch API:OpenAI、Anthropic 等多家對非即時的批次請求提供約 50% 折扣。能容忍幾小時延遲的工作(資料標註、離線分析)一定要用。
  2. 開啟 Prompt Caching:重複的長 system prompt 或文件可以被快取,命中時輸入成本可降到原本的 1/10。RAG 與 agent 應用收益最大。
  3. 用小模型分流:先用便宜模型處理簡單請求,只有困難的才升級到旗艦模型(model routing),平均成本能大幅下降。
  4. 控制輸出長度:輸出 token 通常比輸入貴 2–6 倍。明確要求模型「精簡回答」或設定 max_tokens,省下的就是真金白銀。

結論

2026 年最便宜的 LLM 不再等於「最笨」的模型 —— DeepSeek 等新秀證明了低價也能有高品質。選擇時別只看單一價格,而要結合你的輸入輸出比例品質需求綜合判斷。把上面的省錢技巧搭配起來,常見可以再砍掉一半以上的帳單。

想看完整的 30+ 模型價格與即時排序,請到 首頁比較表,或用 成本計算機 算出你的實際月費。

想知道哪個便宜模型最適合你?

輸入你的用量與需求,推薦精靈會幫你找出最省錢又夠用的 AI 模型。

開始使用推薦精靈

延伸閱讀:GPT-5.5 vs Claude Opus 4.8 全面比較 · 如何選擇適合你的 AI 模型?