La gestion des incidents

Exploitation des services

Comment traiter les incidents le plus efficacement possible et réduire leur survenue ?

La fiche process

Objectifs

Restaurer un service conforme aux niveaux de service définis en un minimum de temps et avec l’impact le plus réduit possible sur le business

Définitions

Incident

Interruption ou réduction de la qualité de service non planifiée ou défaillance d’un composant n’ayant pas encore impacté le service

Modèle d’incident

Circuit de traitement standard pour des incidents de type spécifique. Le modèle définit :

  • Les étapes de résolution à suivre et la chronologie des traitements
  • La prise en compte des dépendances
  • Les ressources, intervenants et responsabilités
  • Les procédures d’escalade

Impact

Niveau d’affectation de l’activité par un incident ou un problème. Il peut se mesurer par :

  • le nombre d’utilisateurs concernés
  • Le chiffre d’affaire perdu
  • La perte d’image
  • Le non respect de contraintes légales ou réglementaires

Urgence

Délai souhaité pour la résolution

Priorité

Priorité avec laquelle l’incident doit être traité. Elle peut être déterminée en combinant l’impact et l’urgence

Crise / incident majeur

Les incidents de priorité très élevées, constituant une atteinte grave aux services ou fortement préjudiciable pour l’activité peuvent faire l’objet d’un traitement particulier en matière de :

  • Pilotage (équipe spécifique, cellule de crise,…)
  • Communication
  • Ressources

Activités

gestion des incidents

Identification et enregistrement

Données enregistrées :

  • Référence unique (« ticket »)
  • Dates d’enregistrement, (prise en charge), résolution, clôture
  • Nom de l’initiateur, porteur de résolution
  • Description, impacts, analyse, description de solution palliative ou définitive
  • Composants, application, système concernée
  • Catégorie et typologie (urgence, niveau d’impact, priorité, incident majeur…)
  • Référence externe (problème, cas, erreur connue,…)

Qualification et priorisation

Collecter et enregistrer les informations permettant de :

  • Comprendre l’incident, ses causes et impacts
  • Identifier des incidents similaires (redondance, rapprochement de cas,…)
  • Déterminer le mode de traitement à appliquer (type, priorité, crise,…)

Diagnostic et escalade

C’est une activité du Service Desk : elle permet ou non une résolution immédiate, dans le cas contraire il y escalade.

L’escalade peut être :

  • technique ou fonctionnelle (problème de compétence)
  • hiérarchique (problème de décision)

Résolution et restauration du service

  • conception d’une solution temporaire/définitive
  • Test de la solution identifiée, validation, autorisation
  • Planification, mise en oeuvre de la correction par le moyen approprié, surveillance éventuelle
  • Enregistrement de la résolution et remise en service

Clôture

  • Analyse et documentation à froid, capitalisation
  • Identification de la récurrence possible et communication vers la gestion des problèmes
  • Communication et vérification de la satisfaction du client/initiateur de l’incident
  • Traitement de clôture du ticket

Indicateurs

Des indicateurs permettent de mesurer l’activité de gestion des incidents, d’autres donnent des informations sur le système d’information lui-même et sont associés au processus de gestion des niveaux de service

Il s’agit par exemple de :

  • quantité et répartition des incidents par :
    • catégories
    • statuts
    • source/origine
    • système impacté…
  • délai de prise en charge, durée de résolution,…
  • coût de prise en charge
  • résolution par niveau de support
  • qualité de l’analyse, pertinence du circuit de traitement,…

Gestion et points d’attention

Gestionnaire des incidents

Il a pour fonctions de :

  • assurer l’efficacité et l’efficience du processus de gestion des incidents, l’améliorer
  • gérer le système de gestion des incidents et les équipes support
  • assurer le reporting
  • gérer les incidents majeurs

Points d’attention

Détection rapide

  • sensibilisation des utilisateurs
  • mise en place de supervision

Qualité de l’enregistrement de tous les incidents

  • influence la qualité et la rapidité de résolution
  • influence le traitement à froid des incidents, cas et problèmes

Outillage

  • Disponibilité des informations sur les problèmes et erreurs connues
  • intégration au CMS pour facilité l’identification des composants impactés, liés,…

Incident versus problème

Un incident est un effet sur la disponibilité ou la qualité du service. Le problème est une cause susceptible de provoquer des incidents. Les incidents ne sont pas tous détectés par l’exploitation, lorsque ce n’est pas le cas, la détection peut passer par le support utilisateur qui traite les demandes quelqu’elles soient.

Du point de vue de Cobit :

^