Retour au blog Bonnes Pratiques - 9 min

Comment réagir en moins d'une heure face à un incident web

Quand votre site tombe ou est piraté, chaque minute compte. Ce protocole d'urgence en 4 phases vous guide de la détection à la résolution en moins de 60 minutes.

Les incidents web arrivent toujours au pire moment — vendredi soir, lors d'une campagne publicitaire importante, ou juste avant une réunion cruciale. La différence entre une équipe qui gère professionnellement un incident et une qui panique réside dans une chose : avoir préparé le protocole d'urgence avant l'incident.

Principes fondamentaux de la gestion d'incident

Avant d'entrer dans la procédure, quelques principes à garder en tête :

Calme et méthode > vitesse : Agir vite et mal empire souvent la situation. Prenez 2 minutes pour comprendre avant d'agir.

Documenter en temps réel : Notez chaque action avec l'heure. Ces notes serviront pour le post-mortem et la prévention future.

Communiquer proactivement : Prévenez les parties prenantes (client, équipe, direction) dès que vous avez confirmé l'incident — avant d'avoir la solution. Le silence inquiète plus que l'honnêteté.

Une chose à la fois : Résister à la tentation de "tout changer" simultanément. Chaque action non ciblée risque d'aggraver le problème.

Phase 0 : Détection (0-5 minutes)

Comment vous apprenez l'incident

  • Alerte de votre outil de monitoring — idéal, vous êtes le premier informé
  • Email ou appel d'un client — pas idéal, mais courant
  • Vous tombez dessus en naviguant — aléatoire
  • Signalement sur les réseaux sociaux — souvent tardif

Première confirmation

Avant tout : confirmez que l'incident est réel et non un faux positif :

  1. Ouvrez votre site en navigation privée depuis votre connexion habituelle
  2. Demandez à quelqu'un dans une autre ville de tester
  3. Utilisez un outil comme downforeveryoneorjustme.com pour un second avis
  4. Vérifiez curl -I https://votresite.fr pour le code HTTP réel

Phase 1 : Containment (5-15 minutes)

Identifier la nature de l'incident

SymptômeType d'incident probablePriorité
Code 500 sur tout le siteProblème serveur/PHPCritique
Code 404 sur pages importantesRedirections casséesÉlevée
Site inaccessible totalementPanne réseau/hébergeurCritique
Contenu bizarre dans les pagesInfection malwareCritique
Formulaires non fonctionnelsBug applicatifÉlevée
Site lent (> 10s)Ressources serveur saturéesÉlevée

Protéger les visiteurs immédiats

Si l'incident peut nuire aux visiteurs (contenu malveillant, erreurs de paiement) :

  1. Activez une page de maintenance (503 + Retry-After)
  2. Si Google Ads actives : Mettez les campagnes en pause immédiatement
  3. Notification d'équipe : Informez les collègues concernés

Note importante : Ne mettez pas en maintenance systématiquement. Pour une simple page 404, la maintenance n'est pas nécessaire. Évaluez d'abord l'impact réel sur les visiteurs.

Phase 2 : Diagnostic (15-30 minutes)

Méthode de diagnostic par élimination

Étape 1 — Quand a commencé le problème ?

  • Consultez vos alertes de monitoring pour l'heure exacte
  • Vérifiez les logs serveur : tail -n 100 /var/log/apache2/error.log
  • Y a-t-il eu une mise à jour, un déploiement ou une action humaine à cette heure ?

Étape 2 — Quelle est l'étendue ?

  • Tout le site ou certaines pages ?
  • Tous les utilisateurs ou certains segments ?
  • Depuis toutes les localisations ou une région spécifique ?

Étape 3 — Quelle est la cause probable ?

  • Mise à jour récente → testez en désactivant les plugins un par un
  • Changement serveur → vérifiez les logs et contactez l'hébergeur
  • Infection → lancez un scan Wordfence/Sucuri

Contacter l'hébergeur

Si le problème semble infrastructurel (serveur, réseau, base de données), contactez l'hébergeur tout de suite — ne perdez pas 20 minutes à diagnostiquer un problème côté hébergeur. Donnez-leur l'heure exacte de début, les codes d'erreur et les symptômes observés.

Phase 3 : Résolution (30-60 minutes)

Restauration ou correction ?

Restauration depuis backup (recommandée si disponible) :

  • Plus rapide et plus sûre qu'un nettoyage à la main
  • Garantit un état propre et connu
  • Inconvénient : pertes des modifications depuis la dernière sauvegarde

Correction directe (si cause clairement identifiée) :

  • Désactivation du plugin problématique
  • Correction du code PHP erroné
  • Correction de la configuration serveur

Validation avant retour en ligne

Avant de sortir de maintenance ou d'annoncer la résolution :

  1. Testez les fonctionnalités critiques (accueil, contact, paiement)
  2. Vérifiez le code HTTP sur vos 5 pages principales
  3. Testez depuis un réseau externe (mobile ou autre)
  4. Vérifiez les logs d'erreur — silence = bon signe

Phase 4 : Communication et post-mortem

Communication transparente

Envoyez un bref email aux parties prenantes :

  • Ce qui s'est passé (en termes simples, sans jargon)
  • Pendant combien de temps
  • Ce qui a été fait pour résoudre
  • Ce qui sera fait pour éviter que ça se reproduise

Post-mortem dans les 24 heures

Documentez pendant que c'est frais :

  • Chronologie complète de l'incident
  • Cause racine identifiée
  • Actions correctives menées
  • Mesures préventives à implémenter

Consultez notre guide sur la procédure d'alerte d'équipe pour formaliser ce processus dans votre organisation.


Articles connexes : Créer une procédure d'alerte | 10 signaux d'alerte | Monitoring web PME

Surveiller mes URL