Google Cloud 良好架構架構說明的成本最佳化支柱中,這項原則提供最佳化建議,協助您根據不斷變動和演變的業務目標,最佳化雲端部署作業的成本。
隨著業務成長和演進,雲端工作負載必須因應資源需求和使用模式的變化而調整。如要從雲端支出中獲得最大價值,您必須在持續支援業務目標的同時,維持成本效益。因此,您必須採取主動且靈活的做法,專注於持續改善和最佳化。
原則總覽
如要持續降低成本,您必須主動監控及分析雲端環境,並視需要調整以符合目前需求。請將監控重點放在直接影響使用者體驗、符合業務目標,以及可提供持續改善洞察的關鍵成效指標 (KPI) 上。這項方法可讓您找出並解決效率不彰的問題、因應不斷變化的需求,並持續將雲端支出與策略性業務目標保持一致。為了兼顧全面的可觀察性和成本效益,請瞭解監控資源用量的成本和效益,並採用適當的程序改善和最佳化策略。
建議
如要有效監控 Google Cloud 環境並持續改善成本效益,請參考下列建議。
著重於與業務相關的指標
有效監控的第一步,就是找出對貴商家和客戶最重要的指標。這些指標包括:
- 使用者體驗指標:延遲時間、錯誤率、傳輸量和客戶滿意度指標,有助於瞭解使用者在使用應用程式時的體驗。
- 業務成效指標:收益、顧客成長和參與度可以與資源使用量建立關聯,以便找出可進行成本最佳化調整的商機。
- 開發運作研究與評估 (DORA) 指標:部署頻率、變更前置時間、變更失敗率和還原時間等指標,可提供軟體交付程序的效率和可靠性相關洞察。改善這些指標有助於提高生產力、減少停機時間,並降低成本。
- 網站可靠性工程 (SRE) 指標:錯誤預算可協助團隊量化及管理可接受的服務中斷程度。透過明確的可靠性預期,錯誤預算可讓團隊更有信心地進行創新和部署變更,並掌握安全邊界。這種主動式做法可在創新與穩定性之間取得平衡,避免因重大停機或長時間停機而導致營運成本過高。
使用可觀察性功能進行資源最佳化
以下是使用可觀察性功能找出雲端部署作業中資源瓶頸和未充分利用的資源的建議:
- 監控資源使用率:使用資源使用率指標,找出未充分利用的Google Cloud 資源。舉例來說,您可以使用 CPU 和記憶體使用率等指標,找出閒置的 VM 資源。針對 Google Kubernetes Engine (GKE),您可以查看詳細的費用明細和費用相關最佳化指標。針對 Google Cloud VMware Engine,請查看資源使用率,以便最佳化 CUD、儲存空間用量和 ESXi 的正確大小。
- 使用雲端最佳化建議:Active Assist 包含一系列智慧工具,可協助您將雲端作業調整至最佳狀態。這些工具會提供可行的建議,協助您降低成本、提高效能、改善安全性,甚至是做出以永續發展為重點的決策。舉例來說,VM 適當規模洞察資料可協助您最佳化資源分配,並避免不必要的支出。
- 將資源使用率與效能做連結:分析資源使用率和應用程式效能之間的關係,判斷是否可以降級至費用較低的資源,且不會影響使用者體驗。
平衡排解問題需求與成本
詳細的觀測資料有助於診斷及排解問題。不過,儲存過多可觀察性資料,或將不必要的資料匯出至外部監控工具,可能會導致不必要的成本。如要有效排除問題,請考慮採用下列建議:
- 收集足夠的資料進行疑難排解:請確保監控解決方案能擷取足夠的資料,以便在問題發生時有效診斷及解決問題。這類資料可能包括不同精細程度的記錄、追蹤記錄和指標。
- 使用取樣和匯總功能:使用取樣和匯總技巧,平衡詳細資料需求與成本考量。這種做法可讓您收集代表性資料,而不會產生過高的儲存空間費用。
- 瞭解監控工具和服務的計價模式:評估不同的監控解決方案,並選擇符合專案特定需求、預算和用量模式的選項。選擇時,請考量資料量、保留規定和必要功能等因素。
- 定期檢查監控設定:移除不必要的指標或記錄,避免收集過多資料。
根據角色量身打造資料收集方式,並設定角色專屬的保留政策
請考量不同角色的特定資料需求。舉例來說,開發人員可能主要需要存取追蹤記錄和應用程式層級記錄,而 IT 管理員可能會著重於系統記錄和基礎架構指標。透過客製化資料收集功能,您可以減少不必要的儲存空間成本,並避免使用者因不相關資訊而感到不堪負荷。
此外,您可以根據各角色的需求和任何法規要求,定義保留政策。舉例來說,開發人員可能只需要存取較短期間的詳細記錄,而財務分析師可能需要長期資料。
考量法規遵循要求
在某些產業,資料保留期限是法規要求。為避免法律和財務風險,您必須確保監控和資料保留做法能協助您遵守相關法規。同時,您也需要維持成本效益。請參考下列建議:
- 請判斷您所在產業或區域的特定資料保留規定,並確保監控策略符合這些規定。
- 導入適當的資料封存和擷取機制,以滿足稽核和法規遵循需求,同時盡量降低儲存成本。
實作智慧型快訊
快訊功能可協助您及時偵測及解決問題。不過,您必須在「讓您掌握最新消息」和「通知過多」之間取得平衡。設計智慧型警示系統後,您就能優先處理對業務影響較大的重大問題。請考慮採用下列最佳化建議:
- 優先處理會影響客戶的問題:針對會直接影響客戶體驗的問題 (例如網站中斷、回應時間過長或交易失敗),設計可快速觸發的快訊。
- 針對暫時性問題進行調整:使用適當的門檻和延遲機制,避免針對暫時性問題或不會影響客戶的自我修復系統問題發出不必要的警報。
- 自訂警示嚴重程度:區分重大和非重大警示,確保最緊急的問題能立即獲得處理。
- 妥善使用通知管道:根據快訊的嚴重程度和緊急程度,選擇適當的快訊通知管道 (電子郵件、簡訊或呼叫器)。