Token 經濟學:搞懂 AI 怎麼計費,不再帳單爆炸
什麼是 Token?各模型怎麼收費?教你精準控制 AI 使用成本,用最少的錢做最多的事。
為什麼你需要懂 Token?
你已經 申請了 API Key,開始用 OpenClaw 了。突然有一天,你收到一封帳單——
「本月 API 使用費:$47.82」
等等,我不是只用了幾天嗎?怎麼就快 50 美金了?
問題出在:你不知道 Token 是什麼,也不知道每次呼叫花了多少。
什麼是 Token?
Token 是 AI 的「計量單位」,就像水電的度數。
但 Token ≠ 字。AI 把文字切成小碎片(稱為 Token),每個碎片可能是一個字、半個字、甚至一個標點符號。
英文 vs 中文
英文: "Hello world" → 2 tokens(每個單字 1 token)
中文: "你好世界" → 4-6 tokens(每個字可能 1-2 tokens)
⚠️ 重要:中文比英文「貴」約 1.5-2 倍,因為中文字拆出更多 Token。
實際拆法
以 OpenAI 的 tokenizer 為例:
| 文字 | Token 數 | 說明 |
|---|---|---|
Hello | 1 | 常見英文單字 = 1 token |
你好 | 2-3 | 每個中文字 ≈ 1-2 tokens |
OpenClaw | 2-3 | 不常見的複合詞會被拆開 |
2024年2月24日 | 5-7 | 數字+中文混合 |
💡 試試看:到 OpenAI Tokenizer 貼上你的文字,看看實際的 Token 數量。
Input Token vs Output Token
每次 AI 呼叫有兩部分費用:
你送出的問題 → Input Token(輸入)
AI 回覆的答案 → Output Token(輸出)
Output Token 通常比 Input Token 貴 2-4 倍。
這就像打電話:聽別人講(input)比自己講(output)便宜。因為 AI 生成回答需要更多計算。
費用結構
總費用 = (Input Token × Input 單價) + (Output Token × Output 單價)
各模型計費方式
截至 2026 年初的主要模型價格(每百萬 Token):
OpenAI
| 模型 | Input 價格 | Output 價格 | 適用場景 |
|---|---|---|---|
| GPT-4o | $2.50 | $10.00 | 日常對話、中等複雜任務 |
| GPT-4o mini | $0.15 | $0.60 | 簡單任務、大量呼叫 |
| GPT-4 Turbo | $10.00 | $30.00 | 需要最好品質的場景 |
| o1 | $15.00 | $60.00 | 數學、程式、複雜推理 |
| 模型 | Input 價格 | Output 價格 | 適用場景 |
|---|---|---|---|
| Gemini 2.0 Flash | 免費(有額度) | 免費(有額度) | 入門首選! |
| Gemini 1.5 Pro | $1.25 | $5.00 | 長文件、多模態 |
Anthropic
| 模型 | Input 價格 | Output 價格 | 適用場景 |
|---|---|---|---|
| Claude 3.5 Sonnet | $3.00 | $15.00 | 寫作、分析、程式 |
| Claude 3 Haiku | $0.25 | $1.25 | 快速回覆、低成本 |
💡 新手建議:先用 Gemini 2.0 Flash(免費額度),等熟悉了再考慮付費模型。 這也是為什麼我們先教你 申請 Google API Key。
成本估算實戰
場景 1:每天用 OpenClaw 整理新聞
假設你每天讓 Agent 做一次「新聞整理」:
- 搜尋 + 輸入:~2,000 tokens
- 整理 + 輸出:~1,500 tokens
- 模型:GPT-4o mini
每天費用 = (2,000 × $0.15 / 1M) + (1,500 × $0.60 / 1M)
= $0.0003 + $0.0009
= $0.0012
每月費用 = $0.0012 × 30 = $0.036(約台幣 1 元)
一個月不到台幣 2 元。 用 mini 模型做簡單任務非常划算。
場景 2:每天寫 5 篇長文
假設每篇需要大量上下文:
- 輸入:~10,000 tokens × 5
- 輸出:~3,000 tokens × 5
- 模型:GPT-4o
每天費用 = (50,000 × $2.50 / 1M) + (15,000 × $10.00 / 1M)
= $0.125 + $0.15
= $0.275
每月費用 = $0.275 × 30 = $8.25(約台幣 270 元)
如果用 GPT-4 Turbo 就是 $33/月。用 mini 可以降到 $0.5/月。
場景 3:為什麼帳單爆了?
常見原因:
| 原因 | 解法 |
|---|---|
| 對話太長,每次帶入全部歷史 | 限制對話記憶長度 |
| 用 GPT-4 做簡單任務 | 降級到 mini |
| Skill 出 bug 無限迴圈 | 設定 Token 上限 |
| 忘記 System Prompt 也算 Token | 精簡 System Prompt |
省錢技巧
1. 選對模型(最重要)
80% 的任務用最便宜的模型就夠了。
簡單問答、分類、摘要 → GPT-4o mini / Gemini Flash
寫文章、分析報告 → GPT-4o / Claude Sonnet
數學、程式、推理 → o1 / Claude Opus
在 OpenClaw 裡,你可以針對不同 Skill 設定不同的模型。
2. 精簡 System Prompt
System Prompt 每次呼叫都會送出,是「隱形成本」。
❌ 500 Token 的 System Prompt × 每天 100 次 = 50,000 tokens/天
✅ 100 Token 的 System Prompt × 每天 100 次 = 10,000 tokens/天
減少 80%!參考 Soul 設定指南 學習如何寫精簡有效的人設。
3. 善用快取(Caching)
OpenAI 和 Anthropic 都支援 Prompt Caching:
- 重複的前綴部分只算一次
- 可以省下 50-80% 的 Input Token 費用
- OpenClaw 內建支援,不需額外設定
4. 限制輸出長度
在 Skill 裡加上 max_tokens 限制:
# 在 Skill 設定中
config:
max_tokens: 500 # 最多產生 500 token 的回覆
5. 設定預算警報
在 OpenAI Dashboard:
- Settings → Billing → Usage limits
- 設定 Hard limit(硬上限)和 Soft limit(警報線)
建議設定:
- Soft limit: $5(提醒你)
- Hard limit: $20(強制停止)
OpenClaw 怎麼幫你省錢?
OpenClaw 內建幾個省錢機制:
- 模型路由:根據任務複雜度自動選模型(在模型設定中配置)
- Agent 記憶壓縮:不會把全部歷史傳送,只保留重要部分
- Skill 快取:相同輸入不重複呼叫
- Token 預算:每個 Skill 可設上限
常見問題
免費額度用完了怎麼辦?
- Google Gemini Flash 每天有免費配額(通常足夠個人使用)
- OpenAI 新帳號有 $5 免費額度(用來試手感)
- 用完就需要儲值,建議先充 $10 試試
我一個月預算只有 100 台幣
完全夠用!用 Gemini Flash(免費)+ GPT-4o mini(超便宜),一般使用每月 $1-3 美金。
Token 會過期嗎?
Token 不是儲值,是用多少算多少。你的 API 額度不會過期(除非是限時優惠)。
下一步
了解 Token 後,你可以:
這篇文章對你有幫助嗎?
💬 問答區
卡關了?直接在這裡問,其他讀者和作者都能幫忙解答。
載入中...