La gestion des incidents
Exploitation des servicesComment traiter les incidents le plus efficacement possible et réduire leur survenue ?
Objectifs
Restaurer un service conforme aux niveaux de service définis en un minimum de temps et avec l’impact le plus réduit possible sur le business
Définitions
Incident
Interruption ou réduction de la qualité de service non planifiée ou défaillance d’un composant n’ayant pas encore impacté le service
Modèle d’incident
Circuit de traitement standard pour des incidents de type spécifique. Le modèle définit :
- Les étapes de résolution à suivre et la chronologie des traitements
- La prise en compte des dépendances
- Les ressources, intervenants et responsabilités
- Les procédures d’escalade
Impact
Niveau d’affectation de l’activité par un incident ou un problème. Il peut se mesurer par :
- le nombre d’utilisateurs concernés
- Le chiffre d’affaire perdu
- La perte d’image
- Le non respect de contraintes légales ou réglementaires
Urgence
Délai souhaité pour la résolution
Priorité
Priorité avec laquelle l’incident doit être traité. Elle peut être déterminée en combinant l’impact et l’urgence
Crise / incident majeur
Les incidents de priorité très élevées, constituant une atteinte grave aux services ou fortement préjudiciable pour l’activité peuvent faire l’objet d’un traitement particulier en matière de :
- Pilotage (équipe spécifique, cellule de crise,…)
- Communication
- Ressources
Activités
Identification et enregistrement
Données enregistrées :
- Référence unique (« ticket »)
- Dates d’enregistrement, (prise en charge), résolution, clôture
- Nom de l’initiateur, porteur de résolution
- Description, impacts, analyse, description de solution palliative ou définitive
- Composants, application, système concernée
- Catégorie et typologie (urgence, niveau d’impact, priorité, incident majeur…)
- Référence externe (problème, cas, erreur connue,…)
Qualification et priorisation
Collecter et enregistrer les informations permettant de :
- Comprendre l’incident, ses causes et impacts
- Identifier des incidents similaires (redondance, rapprochement de cas,…)
- Déterminer le mode de traitement à appliquer (type, priorité, crise,…)
Diagnostic et escalade
C’est une activité du Service Desk : elle permet ou non une résolution immédiate, dans le cas contraire il y escalade.
L’escalade peut être :
- technique ou fonctionnelle (problème de compétence)
- hiérarchique (problème de décision)
Résolution et restauration du service
- conception d’une solution temporaire/définitive
- Test de la solution identifiée, validation, autorisation
- Planification, mise en oeuvre de la correction par le moyen approprié, surveillance éventuelle
- Enregistrement de la résolution et remise en service
Clôture
- Analyse et documentation à froid, capitalisation
- Identification de la récurrence possible et communication vers la gestion des problèmes
- Communication et vérification de la satisfaction du client/initiateur de l’incident
- Traitement de clôture du ticket
Indicateurs
Des indicateurs permettent de mesurer l’activité de gestion des incidents, d’autres donnent des informations sur le système d’information lui-même et sont associés au processus de gestion des niveaux de service
Il s’agit par exemple de :
- quantité et répartition des incidents par :
- catégories
- statuts
- source/origine
- système impacté…
- délai de prise en charge, durée de résolution,…
- coût de prise en charge
- résolution par niveau de support
- qualité de l’analyse, pertinence du circuit de traitement,…
Gestion et points d’attention
Gestionnaire des incidents
Il a pour fonctions de :
- assurer l’efficacité et l’efficience du processus de gestion des incidents, l’améliorer
- gérer le système de gestion des incidents et les équipes support
- assurer le reporting
- gérer les incidents majeurs
Points d’attention
Détection rapide
- sensibilisation des utilisateurs
- mise en place de supervision
Qualité de l’enregistrement de tous les incidents
- influence la qualité et la rapidité de résolution
- influence le traitement à froid des incidents, cas et problèmes
Outillage
- Disponibilité des informations sur les problèmes et erreurs connues
- intégration au CMS pour facilité l’identification des composants impactés, liés,…
Au sommaire
- Généralités
- Stratégie de service
- Conception du service
- Transition du service
- Exploitation du service
Incident versus problème
Un incident est un effet sur la disponibilité ou la qualité du service. Le problème est une cause susceptible de provoquer des incidents. Les incidents ne sont pas tous détectés par l’exploitation, lorsque ce n’est pas le cas, la détection peut passer par le support utilisateur qui traite les demandes quelqu’elles soient.
Du point de vue de Cobit :