Surveillance moderne de la charge de travail

Observez toutes vos charges de travail, y compris les applications conteneurisées et d’IA générative

Avantages

Optimisez les performances et la disponibilité des ressources AWS grâce à une surveillance proactive, à la résolution des problèmes et à des informations basées sur les données, permettant ainsi des opérations cloud fluides, efficaces et sécurisées.

Réduisez le temps moyen de résolution (MTTR) en faisant apparaître les données pour diagnostiquer rapidement la cause première des problèmes.

Unifiez l'observabilité et l’analytique de bout en bout sur les conteneurs et les services sans serveur, en éliminant le balisage fastidieux et la corrélation des événements entre les services.

Surveillez et dépannez les conteneurs et les charges de travail sans serveur pour améliorer la résilience et l'efficacité. Par exemple, vous pouvez tirer parti des fonctionnalités basées sur l'IA et le machine learning de CloudWatch pour interroger les journaux et les métriques en langage naturel, analyser des modèles et détecter des anomalies, et masquer automatiquement les données sensibles dans vos journaux CloudWatch.

Cas d'utilisation

Surveillez et optimisez efficacement les performances de vos ressources d’IA générative en exploitant la puissance d’Amazon Bedrock, Amazon SageMaker et Amazon CloudWatch. Vous pouvez utiliser CloudWatch Container Insights pour découvrir et surveiller automatiquement les indicateurs de santé clés des GPU NVIDIA, des accélérateurs Trainium et Inferentia, des adaptateurs réseau EFA et des HyperPods SageMaker exécutés dans vos clusters Amazon EKS, offrant ainsi une visibilité sur l’utilisation, la disponibilité et la latence des ressources.

Vous pouvez obtenir des informations détaillées sur les performances de vos applications sans serveur en surveillant les indicateurs opérationnels clés tels que la durée d’exécution, les erreurs et les ralentissements grâce à CloudWatch Application Signals. Grâce à CloudWatch Lambda Insights, vous pouvez surveiller les indicateurs de santé clés tels que les indicateurs du processeur, de la mémoire et du réseau dans des tableaux de bord prêts à l’emploi, et tirer parti de CloudWatch Logs Insights pour analyser les données des journaux et le traçage distribué afin d’identifier les goulots d’étranglement potentiels. Ces fonctionnalités de CloudWatch vous permettent d’optimiser vos architectures sans serveur en termes de coût et d’efficacité.

Avec CloudWatch Application Signals, vous pouvez facilement surveiller les indicateurs clés des applications et obtenir facilement des informations sur les performances de vos applications exécutées sur des conteneurs. Vous pouvez traduire vos objectifs commerciaux en SLO pour suivre les performances par rapport aux indicateurs clés de performance (ICP). CloudWatch Application Signals fonctionne avec CloudWatch Container Insights pour fournir des mesures de santé et de performance pour les ressources Amazon EKS et Amazon ECS, permettant ainsi une observabilité de bout en bout pour vos applications.

Les développeurs d’applications et les administrateurs de bases de données (DBA) peuvent accéder à un tableau de bord complet de télémétrie de base de données dans CloudWatch Database Insights pour corréler un ralentissement de leur cluster de bases de données, par exemple Aurora MySQL et PostgreSQL, avec des problèmes affectant les performances de leurs applications. Cela permet d’accélérer le dépannage des bases de données et, en fin de compte, d’offrir une meilleure expérience à l’utilisateur final.