Gemini API 費用指南 2025:Token 計價、免費額度與成本估算
Gemini API 費用指南 2025:Token 計價、免費額度與成本估算
「免費額度用完會怎樣?」「一個月大概要花多少錢?」這是開發者接觸 Gemini API 時最常問的兩個問題。好消息是,Gemini API 的免費額度對小專案來說相當夠用;壞消息是,一旦流量上來,成本可能比你想像的高。
這篇文章會完整拆解 Gemini API 的計價方式,從 token 概念到實際成本估算,幫你做好預算規劃。想了解 Gemini 完整的產品線和費用結構,可參考 Gemini 費用完整指南。

Gemini API 定價模式總覽
Gemini API 採用 Token-based 計價——用多少算多少,沒有月費或訂閱費。
什麼是 Token?
Token 是 AI 模型處理文字的基本單位。它不是「字」也不是「詞」,而是模型切分文字的最小片段。
中文 Token 估算:
- 1 個中文字 ≈ 1.5 - 2 個 tokens
- 1000 字的中文文章 ≈ 1500 - 2000 tokens
英文 Token 估算:
- 4 個英文字母 ≈ 1 個 token
- 1000 字的英文文章 ≈ 750 tokens
Token 怎麼計算?
Gemini API 的費用分為兩部分:
- 輸入 Token:你送給 API 的內容(prompt + 上下文)
- 輸出 Token:AI 回覆給你的內容
輸出 token 通常比輸入 token 貴 2-4 倍,因為生成內容比理解內容需要更多運算。
輸入 vs 輸出價差
| 項目 | 說明 | 價格差異 |
|---|---|---|
| 輸入 Token | 你給 AI 的內容 | 較便宜 |
| 輸出 Token | AI 給你的回覆 | 較貴(2-4 倍) |
實務影響:如果你的應用是「輸入長文、輸出摘要」,成本會比「輸入問題、輸出長文」低很多。
API 成本評估需要幫忙?
Token 計價看起來簡單,但實際用量估算常常失準。讓專業顧問幫你評估,避免上線後帳單爆掉。
Gemini API 免費額度
Google 提供相當大方的免費額度,對開發測試和小型專案很友善。
免費層級限制(2025 年 1 月)
| 模型 | 每分鐘請求數(RPM) | 每日 Token 上限 |
|---|---|---|
| Gemini 1.5 Flash | 15 RPM | 100 萬 tokens |
| Gemini 1.5 Pro | 2 RPM | 5 萬 tokens |
| Gemini 1.0 Pro | 15 RPM | 150 萬 tokens |
免費額度適合什麼用途?
| 用途 | 適合度 | 說明 |
|---|---|---|
| 開發測試 | 非常適合 | 測試功能綽綽有餘 |
| Side Project | 適合 | 小流量應用足夠 |
| MVP 驗證 | 適合 | 先驗證再考慮付費 |
| 生產環境 | 看流量 | 低流量可能夠用 |
| 高流量應用 | 不適合 | 需要付費方案 |
重點:免費額度的限制主要是 RPM(每分鐘請求數),而不是總用量。如果你的應用需要同時處理大量請求,免費額度很快就會不夠。

Gemini API 付費價格表
超過免費額度後,就會開始計費。
價格表(2025 年 1 月)
| 模型 | 輸入價格 | 輸出價格 | 上下文長度 |
|---|---|---|---|
| Gemini 1.5 Flash | $0.075/1M tokens | $0.30/1M tokens | 1M tokens |
| Gemini 1.5 Flash-8B | $0.0375/1M tokens | $0.15/1M tokens | 1M tokens |
| Gemini 1.5 Pro | $1.25/1M tokens | $5.00/1M tokens | 2M tokens |
| Gemini 1.0 Pro | $0.50/1M tokens | $1.50/1M tokens | 32K tokens |
價格為美元,Google 可能隨時調整
各模型特色
Gemini 1.5 Flash
- 最便宜、速度最快
- 適合:高流量應用、即時回應需求
- 品質:中等,適合一般任務
Gemini 1.5 Flash-8B
- 更便宜的輕量版本
- 適合:簡單任務、成本敏感應用
- 品質:較基本
Gemini 1.5 Pro
- 最強模型、價格最高
- 適合:複雜推理、高品質需求
- 品質:最佳
Gemini 1.0 Pro
- 舊版模型、價格中等
- 適合:相容性需求
- 品質:良好但非最新
Gemini vs OpenAI API 費用比較
這是開發者最關心的問題——Gemini API 和 OpenAI API 到底誰便宜?
價格對比表
| 模型 | 輸入價格 | 輸出價格 | 對標 |
|---|---|---|---|
| Gemini 1.5 Flash | $0.075/1M | $0.30/1M | GPT-4o-mini |
| GPT-4o-mini | $0.15/1M | $0.60/1M | - |
| Gemini 1.5 Pro | $1.25/1M | $5.00/1M | GPT-4o |
| GPT-4o | $2.50/1M | $10.00/1M | - |
價格差異分析
| 對比 | Gemini 價格 | 說明 |
|---|---|---|
| Flash vs 4o-mini | 便宜 50% | Gemini 明顯便宜 |
| Pro vs 4o | 便宜 50% | Gemini 明顯便宜 |
結論:同級模型相比,Gemini API 大約便宜 50%。
效能與成本的 Trade-off
便宜不一定好用。選擇時要考慮:
| 面向 | Gemini | OpenAI |
|---|---|---|
| 價格 | 較便宜 | 較貴 |
| 生態系 | 較新 | 較成熟 |
| 文件資源 | 中等 | 豐富 |
| 第三方整合 | 較少 | 非常多 |
| 中文品質 | 中等 | 較好 |
如果你的專案對成本敏感,Gemini 是好選擇;如果需要豐富的第三方工具整合,OpenAI 生態系較完整。
不確定選哪個 API?
Gemini、OpenAI、Claude、Azure⋯⋯API 選擇這麼多,各有優缺點。讓專家根據你的應用場景,推薦最適合的組合。
成本估算實例
理論看完了,來看實際案例。
範例 1:聊天機器人(1000 對話/天)
假設:
- 每次對話:輸入 500 tokens、輸出 300 tokens
- 每天 1000 次對話
- 使用 Gemini 1.5 Flash
計算:
- 每日輸入:500 × 1000 = 50 萬 tokens
- 每日輸出:300 × 1000 = 30 萬 tokens
- 每日成本:(0.5M × $0.075) + (0.3M × $0.30) = $0.0375 + $0.09 = $0.1275
- 每月成本:$0.1275 × 30 = $3.83(約 NT$120)
範例 2:文件摘要服務(100 文件/天)
假設:
- 每份文件:輸入 10000 tokens、輸出 500 tokens
- 每天 100 份文件
- 使用 Gemini 1.5 Pro(品質需求)
計算:
- 每日輸入:10000 × 100 = 100 萬 tokens
- 每日輸出:500 × 100 = 5 萬 tokens
- 每日成本:(1M × $1.25) + (0.05M × $5.00) = $1.25 + $0.25 = $1.50
- 每月成本:$1.50 × 30 = $45(約 NT$1,400)
範例 3:程式碼生成工具(500 請求/天)
假設:
- 每次請求:輸入 800 tokens、輸出 1500 tokens
- 每天 500 次請求
- 使用 Gemini 1.5 Pro(程式碼品質)
計算:
- 每日輸入:800 × 500 = 40 萬 tokens
- 每日輸出:1500 × 500 = 75 萬 tokens
- 每日成本:(0.4M × $1.25) + (0.75M × $5.00) = $0.50 + $3.75 = $4.25
- 每月成本:$4.25 × 30 = $127.5(約 NT$4,000)
成本計算公式
每月成本 = (每日輸入 tokens × 輸入單價 + 每日輸出 tokens × 輸出單價) × 30
降低 API 成本的技巧
成本估算完,接下來是怎麼省錢。
1. Prompt 優化減少 Token
壞的 Prompt(浪費 token):
請你扮演一個非常專業的文章摘要專家,
你需要仔細閱讀以下文章,
然後用你的專業知識,
把文章的重點整理出來...
好的 Prompt(精簡):
摘要以下文章,條列 3 個重點:
2. 選擇適合的模型
| 任務類型 | 建議模型 | 原因 |
|---|---|---|
| 簡單分類 | Flash-8B | 最便宜 |
| 一般對話 | Flash | 夠用且便宜 |
| 複雜推理 | Pro | 品質需求 |
| 長文處理 | Pro | 上下文長 |
3. 快取策略
如果同樣的問題會重複出現,考慮:
- 快取常見問題的回答
- 使用向量資料庫儲存相似問題
- 設定 TTL 定期更新
4. 批次處理
把多個小請求合併成一個大請求:
- 減少 API 呼叫次數
- 降低網路延遲
- 但要注意上下文長度限制
Vertex AI vs AI Studio
使用 Gemini API 有兩種方式,價格和功能略有不同。
兩種存取方式
| 項目 | AI Studio | Vertex AI |
|---|---|---|
| 定位 | 開發者 / 測試 | 企業生產環境 |
| 設定複雜度 | 簡單 | 較複雜 |
| 計費方式 | API Key 直接計費 | GCP 帳單整合 |
| 免費額度 | 較多 | 較少 |
| SLA | 無 | 有 |
| 安全性 | 基本 | 企業級 |
價格差異
Vertex AI 的價格通常比 AI Studio 略高(約 10-20%),但提供:
- 企業級 SLA
- 更好的安全性和合規
- GCP 整合(VPC、IAM)
- 批量折扣
選擇建議
| 情境 | 建議 |
|---|---|
| 個人專案 | AI Studio |
| 小型新創 | AI Studio |
| 企業生產 | Vertex AI |
| 需要 SLA | Vertex AI |
| 已有 GCP | Vertex AI |
如果你是開發者,想順便了解 Google 的程式碼助手工具,可參考 Gemini Code Assist 費用與功能評測。
常見問題 FAQ
超過免費額度會怎樣?
API 會開始計費,不會中斷服務。但如果沒有設定付款方式,可能會被限制存取。建議:
- 設定用量警示
- 設定預算上限
- 綁定付款方式以免服務中斷
如何監控 API 用量?
在 Google Cloud Console 可以查看:
- 即時用量圖表
- 按模型分類的使用量
- 費用預估
也可以透過 API 查詢剩餘配額。
有企業合約折扣嗎?
有。如果你的月用量超過一定金額(通常 $1000+),可以聯繫 Google 談企業折扣,通常可以拿到 10-30% 的折扣。
API 帳單怎麼看?
在 Google Cloud Console → Billing → Reports 可以看到:
- 按服務分類的費用
- 按時間的費用趨勢
- 費用預測
建議設定每日/每月預算警示,避免意外超支。
結論:API 成本規劃建議
開發階段
- 先用免費額度:測試夠用了
- 選對模型:先用 Flash 測試,需要時再換 Pro
- 優化 Prompt:減少不必要的 token
上線階段
- 設定預算警示:避免帳單爆掉
- 監控實際用量:和預估比較
- 考慮快取:減少重複呼叫
規模化階段
- 談企業折扣:用量大可以談價
- 評估 Vertex AI:需要 SLA 就升級
- 混合模型:不同任務用不同模型
需要 API 架構諮詢?
API 成本規劃不只是看價格表,還要考慮架構設計、快取策略、模型選擇。讓專業顧問幫你設計最佳方案。
延伸閱讀
- 回到完整費用指南,請見 Gemini 費用完整指南
- 開發者工具評測,請見 Gemini Code Assist 費用與功能
- 與 ChatGPT API 更詳細比較,請見 Gemini vs ChatGPT 費用比較
- 消費者版本分析,請見 Gemini Advanced 完整功能評測
參考資料
相關文章
Gemini 費用完整指南 2025:免費版 vs 付費版差異、API 定價全解析
完整解析 Google Gemini 費用,包含免費版限制、Advanced 月費 NT$650、API Token 計價。比較 ChatGPT Plus,幫你選最適合的 AI 方案。
GeminiGemini Advanced 值得買嗎?2025 完整功能評測與費用分析
Gemini Advanced 月費 NT$650 值得嗎?完整評測 Gemini 1.5 Pro 模型、100 萬 token 上下文、Google 服務整合功能,附真實使用心得與購買建議。
GeminiGemini Code Assist 費用與功能評測:vs GitHub Copilot 完整比較
Gemini Code Assist 免費版夠用嗎?完整評測程式碼補全、生成、除錯功能,與 GitHub Copilot 詳細比較,幫開發者選對 AI 程式助手。