AWS Systems Manager Incident Manager identifie désormais les causes profondes probables des incidents


À partir d’aujourd’hui, les clients peuvent identifier les causes profondes probables des incidents dans Incident Manager, une fonctionnalité d’AWS Systems Manager. Lorsqu’une alarme ou un événement déclenche un incident, Incident Manager identifie désormais les déploiements AWS CloudFormation et AWS CodeDeploy récents qui incluaient la ressource affectée et ont probablement provoqué l’incident. Les intervenants en cas d’incident verront les détails du déploiement et un lien direct vers le déploiement, accélérant ainsi le diagnostic des causes profondes et réduisant le temps moyen de résolution (MTTR).

Les modifications apportées à l’infrastructure et au code des applications comptent parmi les causes les plus courantes de problèmes de disponibilité et de performances des applications. Ce lancement fournit aux intervenants en cas d’incident les informations critiques dont ils ont besoin pour enquêter sur les causes profondes probables. Par exemple, une mise à jour de la pile CloudFormation qui réduisait la mémoire allouée à une fonction Lambda critique pour l’entreprise pourrait provoquer des erreurs d’appel, obligeant Incident Manager à engager un ingénieur de garde. Désormais, la mise à jour de la pile de causes profondes sera mise en évidence dans l’incident et l’ingénieur de garde pourra rapidement enquêter et résoudre le problème.



Vous pouvez lire l’article original (en Angais) sur le blogaws.amazon.com