モダンなワークロードモニタリング

コンテナ化された AI アプリケーションや生成 AI アプリケーションなど、すべてのワークロードを観察

利点

プロアクティブな監視、問題解決、データ主導のインサイトを通じて AWS リソースのパフォーマンスと可用性を最適化し、円滑で効率的かつ安全なクラウド運用を実現します。

データを表示して問題の根本原因を迅速に診断することで、平均解決時間 (MTTR) を短縮します。

コンテナとサーバーレスサービス全体でエンドツーエンドのオブザーバビリティと分析を統合し、サービス間の面倒なタグ付けやイベントの相関関係を排除します。

コンテナとサーバーレスワークロードのモニタリングとトラブルシューティングを行い、レジリエンスと効率性を高めます。例えば、CloudWatch の AI と ML を利用した機能を活用して、自然言語を使用してログやメトリクスをクエリしたり、パターンを分析して異常を検出したり、CloudWatch ログ内の機密データを自動的にマスクしたりできます。

ユースケース

Amazon Bedrock、Amazon SageMaker、Amazon CloudWatch の力を活用して、生成 AI リソースのパフォーマンスを効果的にモニタリングし、最適化します。CloudWatch Container Insights を使用して、Amazon EKS クラスター内で実行されている NVIDIA GPU、Trainium と Inferentia のアクセラレーター、EFA ネットワークアダプター、SageMaker HyperPod の主要なヘルスメトリクスを自動的に検出してモニタリングできるため、リソースの使用状況、可用性、レイテンシーを可視化できます。

CloudWatch Application Signals を使用して実行時間、エラー、スロットルなどの主要な運用メトリクスを監視することで、サーバーレスアプリケーションのパフォーマンスに関する深いインサイトを得ることができます。CloudWatch Lambda Insights を使用すると、すぐに使用できる厳選されたダッシュボードで CPU、メモリ、ネットワークなどの主要なヘルスメトリクスをモニタリングできます。また、CloudWatch Logs Insights を活用してログデータや分散トレースを分析し、潜在的なボトルネックを特定できます。これらの CloudWatch 機能を活用することで、サーバーレスアーキテクチャを最適化してコストを抑え、効率を高めることができます。

CloudWatch Application Signals により、主要なアプリケーションメトリクスを簡単に監視し、コンテナ上で実行されているアプリケーションのパフォーマンスに関するインサイトを簡単に取得できます。ビジネス目標を SLO に変換して、主要業績評価指標 (KPI) に対するパフォーマンスを追跡できます。CloudWatch Application Signals は CloudWatch Container Insights と連携して Amazon EKS および Amazon ECS リソースの状態とパフォーマンスのメトリクスを提供し、アプリケーションのエンドツーエンドのオブザーバビリティを実現します。

アプリケーション開発者とデータベース管理者 (DBA) は、CloudWatch Database Insights の包括的なデータベーステレメトリダッシュボードにアクセスして、データベースクラスター (Aurora MySQL や PostgreSQL など) の速度低下と、アプリケーションのパフォーマンスに影響している問題を関連付けることができます。これにより、データベースのトラブルシューティングが迅速に行われ、最終的にはエンドユーザーエクスペリエンスが向上します。