透過主動監控、問題解決和資料驅動的洞察來最佳化 AWS 資源效能和可用性,從而實現順暢、高效且安全的雲端操作。
透過顯示資料以快速診斷問題的根本原因,縮短平均解析時間 (MTTR)。
整合容器和無伺服器服務之間的端對端可觀測性和分析,消除跨服務的繁瑣標記和事件關聯。
監控容器和無伺服器工作負載並進行疑難排解,以提高恢復能力和效率。例如,您可以利用 CloudWatch 中 AI 和 ML 支援的功能,使用自然語言查詢日誌和指標,分析模式和偵測異常,以及自動遮罩 CloudWatch Logs 中的敏感資料。
利用 Amazon Bedrock、Amazon SageMaker 和 Amazon CloudWatch 的功能,有效監控並最佳化生成式 AI 資源的效能。您可以使用 CloudWatch Container Insights 自動探索和監控 Amazon EKS 叢集中執行的 NVIDIA GPU、Trainium 和 Inferentia 加速器、EFA 網路介面卡和 SageMaker HyperPod 的關鍵運作狀態指標,從而協助您掌握資源使用率、可用性和延遲。
您可以透過使用 CloudWatch Application Signals 監控關鍵操作指標,例如執行持續時間、錯誤和節流,以此深入了解無伺服器應用程式的效能。使用 CloudWatch Lambda Insights,您可以在立即可用的精選儀表板中監控關鍵運作狀態指標 (例如 CPU、記憶體和網路指標),並利用 CloudWatch Logs Insights 來分析日誌資料和分散式追蹤,進而識別潛在瓶頸。這些 CloudWatch 功能讓您能夠最佳化無伺服器架構,進而降低成本和提升效率。
藉助 CloudWatch Application Signals,您可以輕鬆監控關鍵應用程式指標,並輕鬆了解容器上執行之應用程式的效能。您可以將業務目標轉換為 SLO,以根據關鍵績效指標 (KPI) 追蹤績效。搭配使用 CloudWatch Application Signals 與 CloudWatch Container Insights,即可為 Amazon EKS 和 Amazon ECS 資源提供運作狀態和效能指標,從而實現應用程式的端對端可觀測性。
應用程式開發人員和資料庫管理員 (DBA) 可以存取 CloudWatch Database Insights 中的全面資料庫遙測儀表板,以將其資料庫叢集 (例如 Aurora MySQL 和 PostgreSQL) 中的緩速與影響其應用程式效能的問題進行關聯。這有助於加快資料庫疑難排解,並最終提供更好的最終使用者體驗。