2026 年最便宜的 LLM API 排行榜 — 省錢指南

2026-06-267 分鐘閱讀LLM Price Compare

AI 應用最大的隱形成本，往往就是 API token 費用。同樣一個任務，選對模型可能省下 10 倍以上的開銷。這篇排行榜依照 llmprice.app 的即時價格，整理出 2026 年 6 月最便宜的 LLM API，並附上各價位的推薦與實用的省錢技巧。

最便宜 LLM API 排行榜（依輸入價格）

以下為各家最具性價比的模型，價格單位為每百萬 tokens（1M）美金。「品質分數」為綜合 benchmark 評分，方便你權衡省錢與能力：

模型	提供商	輸入 / 1M	輸出 / 1M	品質
gpt-4o-mini	OpenAI	$0.15	$0.60	80
gpt-5.4-nano	OpenAI	$0.20	$1.25	75
deepseek-chat-v4	DeepSeek	$0.20	$0.80	88
codestral-latest	Mistral	$0.30	$0.90	80
deepseek-reasoner-v4	DeepSeek	$0.44	$0.87	92
gemini-2.5-flash	Google	$0.50	$0.50	84
llama-3.3-70b (Groq)	Groq	$0.59	$0.79	78
gpt-5.4-mini	OpenAI	$0.75	$4.50	85

數據來源：llmprice.app，2026 年 6 月最新官方價格

各價位的最佳選擇

極致省錢（每 1M 輸入 < $0.30）

如果你要處理海量請求、預算極度敏感，DeepSeek Chat v4 是目前的甜蜜點：輸入僅 $0.20、輸出 $0.80，卻有 88 的品質分數，遠勝其他同價位模型。OpenAI 的 gpt-4o-mini 與 gpt-5.4-nano 則勝在生態與穩定度，適合輕量聊天與分類任務。

平衡之選（兼顧品質與成本）

想要更聰明又不想多花錢，DeepSeek Reasoner v4（品質 92、輸出僅 $0.87）在推理任務上 CP 值驚人；Gemini 2.5 Flash 則以輸入輸出同價 $0.50、外加超大 Context Window，成為長文件處理的省錢首選。

需要旗艦品質時

若任務真的需要頂尖能力，Claude Sonnet 4.6（輸入 $3 / 輸出 $3.75，品質 90）通常比旗艦的 Opus 或 GPT-5.5 便宜得多，是「夠好又不貴」的務實選擇。

4 個實用的省錢技巧

善用 Batch API：OpenAI、Anthropic 等多家對非即時的批次請求提供約 50% 折扣。能容忍幾小時延遲的工作（資料標註、離線分析）一定要用。
開啟 Prompt Caching：重複的長 system prompt 或文件可以被快取，命中時輸入成本可降到原本的 1/10。RAG 與 agent 應用收益最大。
用小模型分流：先用便宜模型處理簡單請求，只有困難的才升級到旗艦模型（model routing），平均成本能大幅下降。
控制輸出長度：輸出 token 通常比輸入貴 2–6 倍。明確要求模型「精簡回答」或設定 max_tokens，省下的就是真金白銀。

結論

2026 年最便宜的 LLM 不再等於「最笨」的模型 —— DeepSeek 等新秀證明了低價也能有高品質。選擇時別只看單一價格，而要結合你的輸入輸出比例與品質需求綜合判斷。把上面的省錢技巧搭配起來，常見可以再砍掉一半以上的帳單。

想看完整的 30+ 模型價格與即時排序，請到首頁比較表，或用成本計算機算出你的實際月費。

想知道哪個便宜模型最適合你？

輸入你的用量與需求，推薦精靈會幫你找出最省錢又夠用的 AI 模型。