返回首頁費用優化

AWS 費用優化完整指南:12 個實戰技巧幫你節省 40% 雲端成本【2026 更新】

18 min 分鐘閱讀
#AWS#成本優化#FinOps#Savings Plans#Graviton#Spot Instances#S3

AWS 費用優化完整指南:12 個實戰技巧幫你節省 40% 雲端成本

AWS 費用優化完整指南【2026 更新】

根據我們的實務經驗,大多數企業在 AWS 上可以節省 30-50% 的成本,卻沒有採取行動。

這篇指南整理 12 個經過驗證的成本優化策略,包含 2025-2026 年的最新功能和真實案例數據。

為什麼需要成本優化?

雲端成本失控的常見原因:

問題影響發生率
實例規格過大浪費 30-50% 運算費用約 50% 企業
未使用承諾折扣多付 30-72%約 60% 企業
閒置資源完全浪費平均 30% 資源閒置
儲存類別選錯多付 2-5 倍約 40% 企業

好消息是:這些都可以修正。

1. 了解你的費用結構

優化第一步:知道錢花在哪裡

使用 AWS Cost Explorer

# 查看過去 12 個月成本趨勢
aws ce get-cost-and-usage \
  --time-period Start=2025-02-01,End=2026-02-01 \
  --granularity MONTHLY \
  --metrics "BlendedCost" \
  --group-by Type=DIMENSION,Key=SERVICE

建立成本分類

使用 Cost Allocation Tags 追蹤:

標籤用途範例
Environment區分環境prod, staging, dev
Team追蹤團隊支出backend, frontend, data
Project專案成本歸屬project-alpha
CostCenter財務報告CC-001

2. 採用 Graviton 處理器(節省 40%)

這是 2025-2026 年最有效的成本優化策略

什麼是 Graviton?

AWS Graviton 是 AWS 自研的 ARM 架構處理器,提供:

  • 價格效能提升 40%(相比同級 Intel/AMD)
  • 能源消耗降低 60%
  • 完全相容大多數 Linux 工作負載

真實案例

公司成本節省其他效益
Pinterest47%碳排放降低 62%
SAP35%碳排放降低 45%
SmartNews50%延遲從 190ms 降至 60ms

如何開始?

  1. 評估相容性:使用 Graviton Savings Dashboard
  2. 選擇實例類型
    • m7g:通用運算
    • c7g:運算密集
    • r7g:記憶體密集
  3. 測試遷移:先從非關鍵工作負載開始
# 查看可用的 Graviton 實例類型
aws ec2 describe-instance-types \
  --filters "Name=processor-info.supported-architecture,Values=arm64" \
  --query 'InstanceTypes[*].InstanceType'

3. 善用 Savings Plans

Savings Plans 是 AWS 最靈活的承諾折扣方案。

方案類型比較

類型最高折扣彈性適用服務
Compute Savings Plans66%最高EC2、Fargate、Lambda、SageMaker
EC2 Instance Savings Plans72%中等特定 EC2 系列
Database Savings Plans(新)35%RDS、ElastiCache、Redshift

2025 年新功能:Database Savings Plans

AWS 在 2025 年推出資料庫 Savings Plans:

  • 支援 RDS、ElastiCache、Redshift、MemoryDB
  • 1 年承諾可節省高達 35%
  • 支援 Intel 和 Graviton 實例
  • 適用 Serverless 和 Provisioned 模式

選擇建議

預測性高、長期使用 → 3 年 EC2 Instance Savings Plans(72% 折扣)
需要彈性、多服務 → 1 年 Compute Savings Plans(66% 折扣)
資料庫工作負載 → 1 年 Database Savings Plans(35% 折扣)
不確定用量 → 先從 1 年計畫開始,累積數據後再升級

4. 活用 Spot Instances(節省 90%)

Spot Instances 是 AWS 閒置運算資源,價格可達 On-Demand 的 10%

適用場景

場景適合度原因
批次處理⭐⭐⭐⭐⭐可中斷、可重試
CI/CD 建構⭐⭐⭐⭐⭐短暫任務
開發/測試環境⭐⭐⭐⭐不需 24/7 運行
容器工作負載⭐⭐⭐⭐Kubernetes 天然容錯
機器學習訓練⭐⭐⭐⭐可使用 checkpointing
生產關鍵服務需要額外容錯設計

Spot 最佳實踐

  1. 多元化實例類型:不要只用單一類型
  2. 設定中斷處理:使用 Spot Interruption Handler
  3. 結合 On-Demand:混合使用降低風險
# EKS Spot 配置範例
apiVersion: v1
kind: ConfigMap
metadata:
  name: aws-node
data:
  enable-spot: "true"
  spot-interrupt-handler: "true"

5. 優化 S3 儲存成本

S3 儲存類別選擇錯誤是常見的成本浪費。

儲存類別比較(2026 年定價)

類別價格/GB/月適用場景存取費用
S3 Standard$0.023頻繁存取
S3 Intelligent-Tiering$0.0025-$0.023存取模式不確定監控費
S3 Standard-IA$0.0125不常存取(月)較高
S3 One Zone-IA$0.01非關鍵、可重建較高
S3 Glacier Instant$0.004歸檔但需即時存取
S3 Glacier Flexible$0.0036歸檔(分鐘-小時取回)
S3 Glacier Deep Archive$0.00099長期歸檔(12小時取回)最高

自動化生命週期管理

{
  "Rules": [
    {
      "ID": "MoveToIA",
      "Status": "Enabled",
      "Filter": {"Prefix": "logs/"},
      "Transitions": [
        {"Days": 30, "StorageClass": "STANDARD_IA"},
        {"Days": 90, "StorageClass": "GLACIER"},
        {"Days": 365, "StorageClass": "DEEP_ARCHIVE"}
      ],
      "Expiration": {"Days": 730}
    }
  ]
}

建議:對於存取模式不確定的資料,使用 S3 Intelligent-Tiering 自動優化。

6. 正確調整實例大小(Right-sizing)

AWS 報告顯示,約 50% 的實例規格過大

使用 AWS Compute Optimizer

Compute Optimizer 分析 14 天的 CloudWatch 指標,提供建議:

# 取得 EC2 優化建議
aws compute-optimizer get-ec2-instance-recommendations \
  --instance-arns arn:aws:ec2:ap-northeast-1:123456789012:instance/i-1234567890abcdef0

判斷標準

指標過大的信號建議行動
CPU 平均使用率<20%降低實例大小
記憶體使用率<30%考慮較小實例
網路使用<10% 上限考慮較小實例

常見的降級路徑

m5.xlarge → m5.large(省 50%)
r5.2xlarge → r5.xlarge(省 50%)
c5.4xlarge → c5.2xlarge(省 50%)

7. 關閉閒置資源

常見閒置資源

資源類型檢查方式處理方式
未附加 EBSaws ec2 describe-volumes --filters Name=status,Values=available快照後刪除
未使用 EIPaws ec2 describe-addresses釋放
舊 EBS 快照按日期篩選設定保留政策
閒置 Load Balancer檢查流量刪除或合併
未使用 NAT Gateway檢查流量考慮移除

自動化排程

對於開發/測試環境,使用 AWS Instance Scheduler:

# 週一至週五 9:00-18:00 運行
Schedule:
  - Name: dev-schedule
    Timezone: Asia/Taipei
    Periods:
      - BeginTime: "09:00"
        EndTime: "18:00"
        WeekDays: mon-fri

效益:非工作時間關閉可節省 65% 運算費用。

8. 優化資料傳輸成本

資料傳輸費用常被忽略,但可能佔總成本 10-15%。

資料傳輸定價

類型費用優化方式
區域間傳輸$0.02/GB減少跨區域架構
AZ 間傳輸$0.01/GB同 AZ 部署相關服務
網際網路出站$0.09/GB使用 CloudFront
VPC Endpoint免費(服務端)使用 Gateway Endpoint

優化策略

  1. 使用 S3 Gateway Endpoint:S3 流量免費
  2. CloudFront 取代直接出站:CDN 費用通常更低
  3. 壓縮傳輸資料:減少傳輸量
  4. 同區域部署:避免跨區域費用

9. 設定預算與警報

AWS Budgets 配置

# 建立月度預算
aws budgets create-budget \
  --account-id 123456789012 \
  --budget '{
    "BudgetName": "Monthly-Budget",
    "BudgetLimit": {"Amount": "10000", "Unit": "USD"},
    "BudgetType": "COST",
    "TimeUnit": "MONTHLY"
  }' \
  --notifications-with-subscribers '[{
    "Notification": {
      "NotificationType": "ACTUAL",
      "ComparisonOperator": "GREATER_THAN",
      "Threshold": 80
    },
    "Subscribers": [{
      "SubscriptionType": "EMAIL",
      "Address": "[email protected]"
    }]
  }]'

建議的警報閾值

閾值動作
50%資訊通知
80%警告通知
100%緊急通知 + 調查
120%立即行動

10. 使用 Cost Anomaly Detection

AWS Cost Anomaly Detection 使用機器學習自動偵測異常支出。

設定方式

  1. 在 AWS Cost Management 啟用
  2. 選擇監控範圍(服務、帳戶、成本類別)
  3. 設定警報閾值和通知

效益

  • 自動偵測:不需手動檢查
  • 快速回應:發現異常立即通知
  • 根因分析:顯示異常來源

11. 考慮多雲和混合策略

不是所有工作負載都適合 AWS。

成本比較

服務AWS替代方案節省潛力
物件儲存出站$0.09/GBCloudflare R2($0)100%
CDNCloudFrontCloudflare50-70%
簡單運算EC2DigitalOcean、Hetzner30-50%
AI 推論SageMakerReplicate、Modal視情況

12. 建立 FinOps 文化

成本優化不是一次性專案,需要持續的組織文化。

FinOps 最佳實踐

層面實踐
可見性每個團隊都能看到自己的成本
責任制成本納入團隊 KPI
優化定期檢視和調整
自動化使用工具減少人工作業

建議的審查週期

  • 每日:異常警報檢查
  • 每週:使用率報告
  • 每月:成本趨勢分析
  • 每季:Savings Plans 檢視
  • 每年:架構成本審查

快速檢查清單

立即可做的優化:

  • 啟用 Cost Explorer 和 Budgets
  • 檢查未使用的 EBS、EIP、Load Balancer
  • 評估 Graviton 遷移可行性
  • 分析 Savings Plans 購買機會
  • 設定 S3 Lifecycle Policy
  • 關閉非工作時間的開發環境
  • 檢查過大的實例規格

總結

優化策略節省潛力實施難度
Graviton 遷移40%
Savings Plans30-72%
Spot Instances60-90%
Right-sizing30-50%
S3 優化50-70%
關閉閒置資源100%(該資源)

常見問題 FAQ

Q1: AWS 帳單忽然暴漲,如何在一天內找出原因?

四步驟診斷法。(1) Cost Explorer Group by 「Service」——看是哪個服務大幅成長,通常最大宗是 EC2、RDS、Data Transfer、S3;(2) 再 Group by 「Usage Type」——確認是 instance hours、data transfer、API calls 還是 storage 造成;(3) Group by 「Linked Account / Tag」——找到哪個帳號 / 專案 / 團隊的問題;(4) CloudTrail 查 API 呼叫——看是不是程式碼 bug 造成無窮迴圈 call AWS API(每次 list S3 都要錢)。常見根因 top 5:(A) NAT Gateway data transfer——有人把大量流量走 NAT 而非 VPC Endpoint(如 S3、DynamoDB),每 GB 費用翻倍;(B) CloudWatch Logs——某個 container 失控 log,單月可噴 US$10,000+;(C) 忘關的大型 EC2 instance(p4d、x2iedn 等每小時 $20+);(D) S3 請求費——程式碼狂 HEAD 物件;(E) 跨區流量——忘記用 CloudFront 或設定錯誤 routing。預防:設 AWS Budget Alert(每月一到達 80% 就告警),並用 AWS Cost Anomaly Detection 自動偵測異常。

Q2: Savings Plans 和 Reserved Instance(RI)差在哪?該買哪個?

2024 年起 AWS 主推 Savings Plans,RI 多數使用情境已經被 SP 取代。核心差異:(1) Savings Plans——按「承諾每小時花多少錢」買,彈性極高,可跨 instance family、region、OS 使用;(2) Reserved Instance——按「承諾特定 instance type」買,只能該 family 打折,彈性低但某些特定場景(DB instance、Redshift)折扣更深。實務建議:(A) EC2 / Fargate / Lambda 用 Compute Savings Plans——最彈性;(B) 特定 instance family 穩定使用(如 c5 長期跑 batch job)用 EC2 Savings Plans——比 Compute SP 折扣深 5–10%;(C) RDS / ElastiCache / Redshift 只能用 RI(還沒有 SP);(D) DynamoDB 用 Reserved Capacity;(E) 永遠不要一次買 3 年全額預付——彈性為零,企業規模變化會被套住。買多少的經驗法則:用 Cost Explorer 看過去 12 個月的「穩定基線」(最低那部分),用 70–80% 承諾,保留 20–30% 彈性給 on-demand。

Q3: Graviton 遷移真的能省 40% 嗎?相容性問題如何處理?

能省,但取決於 workload。實際數字:(1) 同等級 Graviton vs x86——AWS 標價 m7g 比 m6i 便宜 20%;(2) 同等級效能下——Graviton 通常需要 10–20% fewer instance,整體 cost-per-performance 比 x86 省 30–40%;(3) 特定 workload 甚至省更多——Java/Go/Python 原生跑 ARM 幾乎無縫,省 40% 常見。相容性現況(2025):(A) 容器化服務——若用 Docker 多數都支援 multi-arch build,幾乎無痛;(B) 常見語言 runtime——Python、Node.js、Go、Java、.NET 6+ 都原生支援 ARM64;(C) 會有問題的——C/C++ native extension(編譯過的 binary 要重編)、舊版 .NET Framework、某些 proprietary 軟體(Oracle DB Enterprise Edition 還要買 ARM 授權)、GPU 負載(Graviton 沒有 GPU option)。遷移策略:(A) 先挑無狀態服務(Web App、Lambda、Fargate task);(B) CI/CD 加入 linux/arm64 build target;(C) 用 EC2 multi-arch ASG 灰度遷移(10% → 50% → 100%);(D) DB 可放最後,相容性風險高。

Q4: 我們公司沒有 FinOps 人員,該怎麼開始做 AWS 成本治理?

小公司從三件事開始,不需要專職 FinOps。(1) 每月 AWS 成本 Review 會議(30 分鐘)——工程主管 + 財務 + CTO 一起看 Cost Explorer,討論「top 5 最貴服務」為什麼貴、是否合理;(2) 開啟免費的三大工具——AWS Cost Explorer、AWS Budgets(設每月總支出 alert)、AWS Trusted Advisor 的 Cost 類別建議;(3) 建立 Tagging policy——至少所有資源都要有 Environment(prod / staging / dev)、TeamProject 三個 tag;用 AWS Config 設 rule 強制無 tag 的新資源不能啟動。第二階段(公司 AWS 月支出 > US$30,000 後):(A) 導入 AWS Cost Anomaly Detection——自動偵測異常;(B) 建立 Savings Plans 採購策略——每季檢視承諾量;(C) 用 Cost and Usage Report (CUR) + QuickSight / Athena 做自訂分析。什麼時候該找專職 FinOps:月支出 > US$200,000、有 10+ AWS account、或被老闆問「為什麼 AWS 帳單又漲」超過 3 次。

Q5: 用 Spot Instance 被中斷的風險真的能接受嗎?企業級工作能用嗎?

越來越多企業級 workload 能用,但要設計對。Spot 中斷現實:(1) 中斷率——AWS 官方數據顯示 2024 年 Spot 平均中斷率 < 5%/月(依 region、instance type 差異);(2) 中斷會給 2 分鐘預告——透過 metadata service 通知;(3) 不是所有 instance 一起中斷——AWS 會分散 pool。適合 Spot 的 workload:(A) 容錯 batch job(資料處理、渲染、ML training、ETL)——中斷就重跑,影響只是延遲;(B) 無狀態 Web 服務——配合 ASG / ECS,用 mixed instance policy 混 on-demand + spot;(C) 開發 / 測試環境——完全可用 spot;(D) CI/CD runner——Jenkins、GitLab runner、GitHub Actions self-hosted。不適合:(A) 需強一致性的 DB(主 DB 節點不該用);(B) 長時間狀態保存(session store,除非有持久化);(C) 即時交易系統——分秒必爭不能中斷。企業落地技巧:(1) 用 EC2 Fleet / Auto Scaling group with mixed instances,設 on-demand base(如 20%)+ spot top-up(80%);(2) 分散多 instance type(m5、m5a、m5n、c5)以降低整體中斷率;(3) 用 EKS Karpenter 或 ECS capacity provider 自動處理中斷。實務上成熟團隊能達到 70–80% spot 使用率,節省數百萬。


需要專業的 AWS 成本優化諮詢?

CloudInsight 提供:

  • 免費成本健檢(分析您的 AWS 帳單)
  • 客製化優化策略
  • Savings Plans 購買建議
  • 持續的成本監控服務

預約免費成本健檢,讓我們幫你找出節省空間。


參考資源

需要專業的雲端建議?

無論您正在評估雲平台、優化現有架構,或尋找節費方案,我們都能提供協助

預約免費諮詢

相關文章