Gemini API 費用指南 2026：Token 計價、免費額度與成本估算

12/17/202519 min 分鐘閱讀

#Gemini API#API 定價#Token 計價#Google AI#開發者工具#API 成本#Vertex AI#AI Studio#LLM API#生成式 AI

Gemini API 費用指南 2026：Token 計價、免費額度與成本估算

2026 年 7 月更新：Google 於 7 月 21 日發布 Gemini 3.6 Flash、3.5 Flash-Lite 與 3.5 Flash Cyber；同時 Gemini 2.0 Flash 與 2.0 Flash-Lite 已於 2026 年 6 月 1 日正式停用。本文價格表已依 Gemini API 官方定價頁全面更新。

「免費額度用完會怎樣？」「一個月大概要花多少錢？」這是開發者接觸 Gemini API 時最常問的兩個問題。好消息是，Gemini API 的免費額度對小專案來說相當夠用；壞消息是，一旦流量上來，成本可能比你想像的高。

這篇文章會完整拆解 Gemini API 的計價方式，從 token 概念到實際成本估算，幫你做好預算規劃。想了解 Gemini 完整的產品線和費用結構，可參考 Gemini 費用完整指南。

Gemini API 定價架構總覽

Gemini API 定價模式總覽

Gemini API 採用 Token-based 計價——用多少算多少，沒有月費或訂閱費。

什麼是 Token？

Token 是 AI 模型處理文字的基本單位。它不是「字」也不是「詞」，而是模型切分文字的最小片段。

中文 Token 估算：

1 個中文字 ≈ 1.5 - 2 個 tokens
1000 字的中文文章 ≈ 1500 - 2000 tokens

英文 Token 估算：

4 個英文字母 ≈ 1 個 token
1000 字的英文文章 ≈ 750 tokens

Token 怎麼計算？

Gemini API 的費用分為兩部分：

輸入 Token：你送給 API 的內容（prompt + 上下文）
輸出 Token：AI 回覆給你的內容

輸出 token 通常比輸入 token 貴 2-4 倍，因為生成內容比理解內容需要更多運算。

輸入 vs 輸出價差

項目	說明	價格差異
輸入 Token	你給 AI 的內容	較便宜
輸出 Token	AI 給你的回覆	較貴（2-4 倍）

實務影響：如果你的應用是「輸入長文、輸出摘要」，成本會比「輸入問題、輸出長文」低很多。

API 成本評估需要幫忙？

Token 計價看起來簡單，但實際用量估算常常失準。讓專業顧問幫你評估，避免上線後帳單爆掉。

預約架構諮詢

Gemini API 免費額度

Google 提供相當大方的免費額度，對開發測試和小型專案很友善。

免費層級怎麼查（2026 年 7 月現況）

要提醒一件事：Google 官方文件已不再公佈固定的免費額度數字。官方速率限制頁現在明確寫著額度「取決於你的使用層級等多項因素」，並要求開發者登入 Google AI Studio 查看自己帳號的即時額度。

換句話說，網路上任何一張標著「Gemini 免費額度 15 RPM／每日 100 萬 tokens」的表格，都已經不能當作依據——包含本文舊版曾列出的那張。

正確做法：到 AI Studio 速率限制頁面查看你自己帳號的實際數字。額度會隨帳號層級（是否綁定付款方式、歷史用量）而不同。

目前多數 Gemini 模型仍提供免費層級 token，包含 3.6 Flash、3.5 Flash、3.5 Flash-Lite、3.1 Flash-Lite、2.5 系列與 Gemini Embedding；但影像／影片生成類（3.1 Flash Image、3 Pro Image 等）與 Pro Preview 系列則沒有免費層級。

免費額度適合什麼用途？

用途	適合度	說明
開發測試	非常適合	測試功能綽綽有餘
Side Project	適合	小流量應用足夠
MVP 驗證	適合	先驗證再考慮付費
生產環境	看流量	低流量可能夠用
高流量應用	不適合	需要付費方案

重點：免費額度的限制主要是 RPM（每分鐘請求數），而不是總用量。如果你的應用需要同時處理大量請求，免費額度很快就會不夠。

Gemini API 免費額度使用監控介面

Gemini API 付費價格表

超過免費額度後，就會開始計費。

主力文字模型價格表（2026 年 7 月）

模型	輸入價格	輸出價格	定位
Gemini 3.6 Flash	$1.50/1M tokens	$7.50/1M tokens	現行主力，輸出 token 較 3.5 Flash 少 17%
Gemini 3.5 Flash	$1.50/1M tokens	$9.00/1M tokens	前一代主力
Gemini 3.5 Flash-Lite	$0.30/1M tokens	$2.50/1M tokens	3.5 級最省，高吞吐用
Gemini 3.1 Flash-Lite	$0.25/1M tokens	$1.50/1M tokens	更省，音訊輸入 $0.50
Gemini 3.1 Pro Preview	$2.00（≤200k）/ $4.00（>200k）	$12.00（≤200k）/ $18.00（>200k）	高階推理，無免費層級
Gemini 2.5 Pro	$1.25（≤200k）/ $2.50（>200k）	$10.00（≤200k）/ $15.00（>200k）	上一代旗艦，仍可用
Gemini 2.5 Flash-Lite	$0.10/1M tokens	$0.40/1M tokens	全線最便宜

價格為美元，來源：Gemini API 官方定價頁，Google 可能隨時調整

⚠️ 已停用模型：Gemini 2.0 Flash 與 2.0 Flash-Lite 已於 2026 年 6 月 1 日關閉；Veo 2／Veo 3 已於 6 月 30 日關閉；Imagen 4 將於 8 月 17 日關閉。若你的程式碼還寫死這些型號，服務已經或即將中斷。

各模型特色

Gemini 3.6 Flash

現行主力機種，Google 定位為「workhorse」
相較 3.5 Flash 減少約 17% 輸出 token 用量，等於同樣任務更便宜
適合：多數生產環境、agent 應用

Gemini 3.5 Flash-Lite

3.5 級中最便宜、最快，官方引用 Artificial Analysis 數據為每秒 350 個輸出 token
適合：高吞吐、成本敏感的批次處理

Gemini 2.5 Flash-Lite

目前全線單價最低（$0.10／$0.40）
適合：簡單分類、標記等低複雜度任務

Gemini 3.1 Pro Preview

高階推理，長上下文（>200k）另有級距計價
無免費層級，測試就開始計費

Gemini 3.5 Flash Cyber

資安專用微調模型，用於找出並修補漏洞
一般開發者買不到：目前僅透過 CodeMender 開放給政府與信任夥伴的限量試點

Gemini vs OpenAI API 費用比較

這是開發者最關心的問題——Gemini API 和 OpenAI API 到底誰便宜？

價格對比表（2026 年 7 月）

級距	Gemini	價格（輸入／輸出）	OpenAI	價格（輸入／輸出）
入門	Gemini 2.5 Flash-Lite	$0.10／$0.40	GPT-5.4-nano	$0.20／$1.25
輕量	Gemini 3.5 Flash-Lite	$0.30／$2.50	GPT-5.4-mini	$0.75／$4.50
主力	Gemini 3.6 Flash	$1.50／$7.50	GPT-5.6 Luna	$1.00／$6.00
高階	Gemini 3.1 Pro Preview	$2.00／$12.00	GPT-5.6 Terra	$2.50／$15.00
旗艦	Gemini 2.5 Pro	$1.25／$10.00	GPT-5.6 Sol	$5.00／$30.00

OpenAI 價格來源：OpenAI API 官方定價頁（GPT-5.6 於 2026 年 7 月 9 日 GA）

價格差異分析

對比	誰便宜	差距
入門級（2.5 Flash-Lite vs 5.4-nano）	Gemini	輸入省 50%、輸出省 68%
輕量級（3.5 Flash-Lite vs 5.4-mini）	Gemini	輸入省 60%、輸出省 44%
主力級（3.6 Flash vs 5.6 Luna）	OpenAI	Gemini 輸入貴 50%、輸出貴 25%
高階級（3.1 Pro Preview vs 5.6 Terra）	Gemini	輸入省 20%、輸出省 20%
旗艦級（2.5 Pro vs 5.6 Sol）	Gemini	輸入省 75%、輸出省 67%

結論（與舊版不同，請注意）：過去「Gemini 一律比 OpenAI 便宜約 50%」的說法在 2026 年已經不成立。

現況是分級距的：

輕量與旗艦級，Gemini 仍有明顯價格優勢
主力級，OpenAI 的 GPT-5.6 Luna（$1.00／$6.00）反而比 Gemini 3.6 Flash（$1.50／$7.50）便宜

所以選型不能再用「Google 比較便宜」一句話帶過，要看你實際落在哪個級距。如果主要負載在主力級，值得重算一次。

效能與成本的 Trade-off

便宜不一定好用。選擇時要考慮：

面向	Gemini	OpenAI
價格	較便宜	較貴
生態系	較新	較成熟
文件資源	中等	豐富
第三方整合	較少	非常多
中文品質	中等	較好

如果你的專案對成本敏感，Gemini 是好選擇；如果需要豐富的第三方工具整合，OpenAI 生態系較完整。

不確定選哪個 API？

Gemini、OpenAI、Claude、Azure⋯⋯API 選擇這麼多，各有優缺點。讓專家根據你的應用場景，推薦最適合的組合。

預約 AI 導入諮詢

成本估算實例

理論看完了，來看實際案例。

範例 1：聊天機器人（1000 對話/天）

假設：

每次對話：輸入 500 tokens、輸出 300 tokens
每天 1000 次對話
使用 Gemini 3.5 Flash-Lite

計算：

每日輸入：500 × 1000 = 50 萬 tokens
每日輸出：300 × 1000 = 30 萬 tokens
每日成本：(0.5M × $0.30) + (0.3M × $2.50) = $0.15 + $0.75 = $0.90
每月成本：$0.90 × 30 = $27（約 NT$864）

範例 2：文件摘要服務（100 文件/天）

假設：

每份文件：輸入 10000 tokens、輸出 500 tokens
每天 100 份文件
使用 Gemini 3.1 Pro Preview（品質需求）

計算：

每日輸入：10000 × 100 = 100 萬 tokens
每日輸出：500 × 100 = 5 萬 tokens
每日成本：(1M × $2.00) + (0.05M × $12.00) = $2.00 + $0.60 = $2.60
每月成本：$2.60 × 30 = $78（約 NT$2,496）

範例 3：程式碼生成工具（500 請求/天）

假設：

每次請求：輸入 800 tokens、輸出 1500 tokens
每天 500 次請求
使用 Gemini 3.6 Flash（程式碼品質）

計算：

每日輸入：800 × 500 = 40 萬 tokens
每日輸出：1500 × 500 = 75 萬 tokens
每日成本：(0.4M × $1.50) + (0.75M × $7.50) = $0.60 + $5.63 = $6.23
每月成本：$6.23 × 30 = $186.9（約 NT$5,981）

台幣換算以 1 美元約 32 元估算，實際依當時匯率與信用卡手續費而異

成本計算公式

每月成本 = (每日輸入 tokens × 輸入單價 + 每日輸出 tokens × 輸出單價) × 30

對照舊版價格會發現成本明顯上升——這不是估算方式改變，而是 Gemini 產品線的單價結構在 1.5 世代之後整體調高。若你的預算還沿用 2025 年的估算，建議重算。

降低 API 成本的技巧

成本估算完，接下來是怎麼省錢。

1. Prompt 優化減少 Token

壞的 Prompt（浪費 token）：

請你扮演一個非常專業的文章摘要專家，
你需要仔細閱讀以下文章，
然後用你的專業知識，
把文章的重點整理出來...

好的 Prompt（精簡）：

摘要以下文章，條列 3 個重點：

2. 選擇適合的模型

任務類型	建議模型	原因
簡單分類、標記	Gemini 2.5 Flash-Lite	全線單價最低
高吞吐批次處理	Gemini 3.5 Flash-Lite	速度快、單價低
一般對話、agent	Gemini 3.6 Flash	現行主力，輸出 token 較省
複雜推理	Gemini 3.1 Pro Preview	品質需求
長文處理（>200k）	Gemini 2.5 Pro	長上下文級距單價較低

3. 快取策略

如果同樣的問題會重複出現，考慮：

快取常見問題的回答
使用向量資料庫儲存相似問題
設定 TTL 定期更新

4. 批次處理

把多個小請求合併成一個大請求：

減少 API 呼叫次數
降低網路延遲
但要注意上下文長度限制

Vertex AI vs AI Studio

使用 Gemini API 有兩種方式，價格和功能略有不同。

兩種存取方式

項目	AI Studio	Vertex AI
定位	開發者 / 測試	企業生產環境
設定複雜度	簡單	較複雜
計費方式	API Key 直接計費	GCP 帳單整合
免費額度	較多	較少
SLA	無	有
安全性	基本	企業級

價格差異

Vertex AI 的價格通常比 AI Studio 略高（約 10-20%），但提供：

企業級 SLA
更好的安全性和合規
GCP 整合（VPC、IAM）
批量折扣

選擇建議

情境	建議
個人專案	AI Studio
小型新創	AI Studio
企業生產	Vertex AI
需要 SLA	Vertex AI
已有 GCP	Vertex AI

如果你是開發者，想順便了解 Google 的程式碼助手工具，可參考 Gemini Code Assist 費用與功能評測。

常見問題 FAQ

超過免費額度會怎樣？

API 會開始計費，不會中斷服務。但如果沒有設定付款方式，可能會被限制存取。建議：

設定用量警示
設定預算上限
綁定付款方式以免服務中斷

如何監控 API 用量？

在 Google Cloud Console 可以查看：

即時用量圖表
按模型分類的使用量
費用預估

也可以透過 API 查詢剩餘配額。

有企業合約折扣嗎？

有。如果你的月用量超過一定金額（通常 $1000+），可以聯繫 Google 談企業折扣，通常可以拿到 10-30% 的折扣。

API 帳單怎麼看？

在 Google Cloud Console → Billing → Reports 可以看到：

按服務分類的費用
按時間的費用趨勢
費用預測

建議設定每日/每月預算警示，避免意外超支。

結論：API 成本規劃建議

開發階段

先用免費額度：測試夠用了
選對模型：先用 Flash 測試，需要時再換 Pro
優化 Prompt：減少不必要的 token

上線階段

設定預算警示：避免帳單爆掉
監控實際用量：和預估比較
考慮快取：減少重複呼叫

規模化階段

談企業折扣：用量大可以談價
評估 Vertex AI：需要 SLA 就升級
混合模型：不同任務用不同模型

需要 API 架構諮詢？

API 成本規劃不只是看價格表，還要考慮架構設計、快取策略、模型選擇。讓專業顧問幫你設計最佳方案。

預約成本優化諮詢

參考資料

需要專業的雲端建議？

無論您正在評估雲平台、優化現有架構，或尋找節費方案，我們都能提供協助

預約免費諮詢

Gemini

Gemini API 費用指南 2026：Token 計價、免費額度與成本估算

Gemini API 定價模式總覽

什麼是 Token？

Token 怎麼計算？

輸入 vs 輸出價差

API 成本評估需要幫忙？

Gemini API 免費額度

免費層級怎麼查（2026 年 7 月現況）

免費額度適合什麼用途？

Gemini API 付費價格表

主力文字模型價格表（2026 年 7 月）

各模型特色

Gemini vs OpenAI API 費用比較

價格對比表（2026 年 7 月）

價格差異分析

效能與成本的 Trade-off

不確定選哪個 API？

成本估算實例

範例 1：聊天機器人（1000 對話/天）

範例 2：文件摘要服務（100 文件/天）

範例 3：程式碼生成工具（500 請求/天）

成本計算公式

降低 API 成本的技巧

1. Prompt 優化減少 Token

2. 選擇適合的模型

3. 快取策略

4. 批次處理

Vertex AI vs AI Studio

兩種存取方式

價格差異

選擇建議

常見問題 FAQ

超過免費額度會怎樣？

如何監控 API 用量？

有企業合約折扣嗎？

API 帳單怎麼看？

結論：API 成本規劃建議

開發階段

上線階段

規模化階段

需要 API 架構諮詢？

延伸閱讀

參考資料

需要專業的雲端建議？

相關文章

Gemini 費用完整指南 2026：免費版 vs 付費版差異、API 定價全解析

Gemini Advanced 值得買嗎？（現已改名 Google AI Pro）2026 完整功能評測與費用分析

Gemini Code Assist 費用與功能評測：vs GitHub Copilot 完整比較