Comment réagir en moins d'une heure face à un incident web
Quand votre site tombe ou est piraté, chaque minute compte. Ce protocole d'urgence en 4 phases vous guide de la détection à la résolution en moins de 60 minutes.
Les incidents web arrivent toujours au pire moment — vendredi soir, lors d'une campagne publicitaire importante, ou juste avant une réunion cruciale. La différence entre une équipe qui gère professionnellement un incident et une qui panique réside dans une chose : avoir préparé le protocole d'urgence avant l'incident.
Principes fondamentaux de la gestion d'incident
Avant d'entrer dans la procédure, quelques principes à garder en tête :
Calme et méthode > vitesse : Agir vite et mal empire souvent la situation. Prenez 2 minutes pour comprendre avant d'agir.
Documenter en temps réel : Notez chaque action avec l'heure. Ces notes serviront pour le post-mortem et la prévention future.
Communiquer proactivement : Prévenez les parties prenantes (client, équipe, direction) dès que vous avez confirmé l'incident — avant d'avoir la solution. Le silence inquiète plus que l'honnêteté.
Une chose à la fois : Résister à la tentation de "tout changer" simultanément. Chaque action non ciblée risque d'aggraver le problème.
Phase 0 : Détection (0-5 minutes)
Comment vous apprenez l'incident
- Alerte de votre outil de monitoring — idéal, vous êtes le premier informé
- Email ou appel d'un client — pas idéal, mais courant
- Vous tombez dessus en naviguant — aléatoire
- Signalement sur les réseaux sociaux — souvent tardif
Première confirmation
Avant tout : confirmez que l'incident est réel et non un faux positif :
- Ouvrez votre site en navigation privée depuis votre connexion habituelle
- Demandez à quelqu'un dans une autre ville de tester
- Utilisez un outil comme
downforeveryoneorjustme.compour un second avis - Vérifiez
curl -I https://votresite.frpour le code HTTP réel
Phase 1 : Containment (5-15 minutes)
Identifier la nature de l'incident
| Symptôme | Type d'incident probable | Priorité |
|---|---|---|
| Code 500 sur tout le site | Problème serveur/PHP | Critique |
| Code 404 sur pages importantes | Redirections cassées | Élevée |
| Site inaccessible totalement | Panne réseau/hébergeur | Critique |
| Contenu bizarre dans les pages | Infection malware | Critique |
| Formulaires non fonctionnels | Bug applicatif | Élevée |
| Site lent (> 10s) | Ressources serveur saturées | Élevée |
Protéger les visiteurs immédiats
Si l'incident peut nuire aux visiteurs (contenu malveillant, erreurs de paiement) :
- Activez une page de maintenance (503 + Retry-After)
- Si Google Ads actives : Mettez les campagnes en pause immédiatement
- Notification d'équipe : Informez les collègues concernés
Note importante : Ne mettez pas en maintenance systématiquement. Pour une simple page 404, la maintenance n'est pas nécessaire. Évaluez d'abord l'impact réel sur les visiteurs.
Phase 2 : Diagnostic (15-30 minutes)
Méthode de diagnostic par élimination
Étape 1 — Quand a commencé le problème ?
- Consultez vos alertes de monitoring pour l'heure exacte
- Vérifiez les logs serveur :
tail -n 100 /var/log/apache2/error.log - Y a-t-il eu une mise à jour, un déploiement ou une action humaine à cette heure ?
Étape 2 — Quelle est l'étendue ?
- Tout le site ou certaines pages ?
- Tous les utilisateurs ou certains segments ?
- Depuis toutes les localisations ou une région spécifique ?
Étape 3 — Quelle est la cause probable ?
- Mise à jour récente → testez en désactivant les plugins un par un
- Changement serveur → vérifiez les logs et contactez l'hébergeur
- Infection → lancez un scan Wordfence/Sucuri
Contacter l'hébergeur
Si le problème semble infrastructurel (serveur, réseau, base de données), contactez l'hébergeur tout de suite — ne perdez pas 20 minutes à diagnostiquer un problème côté hébergeur. Donnez-leur l'heure exacte de début, les codes d'erreur et les symptômes observés.
Phase 3 : Résolution (30-60 minutes)
Restauration ou correction ?
Restauration depuis backup (recommandée si disponible) :
- Plus rapide et plus sûre qu'un nettoyage à la main
- Garantit un état propre et connu
- Inconvénient : pertes des modifications depuis la dernière sauvegarde
Correction directe (si cause clairement identifiée) :
- Désactivation du plugin problématique
- Correction du code PHP erroné
- Correction de la configuration serveur
Validation avant retour en ligne
Avant de sortir de maintenance ou d'annoncer la résolution :
- Testez les fonctionnalités critiques (accueil, contact, paiement)
- Vérifiez le code HTTP sur vos 5 pages principales
- Testez depuis un réseau externe (mobile ou autre)
- Vérifiez les logs d'erreur — silence = bon signe
Phase 4 : Communication et post-mortem
Communication transparente
Envoyez un bref email aux parties prenantes :
- Ce qui s'est passé (en termes simples, sans jargon)
- Pendant combien de temps
- Ce qui a été fait pour résoudre
- Ce qui sera fait pour éviter que ça se reproduise
Post-mortem dans les 24 heures
Documentez pendant que c'est frais :
- Chronologie complète de l'incident
- Cause racine identifiée
- Actions correctives menées
- Mesures préventives à implémenter
Consultez notre guide sur la procédure d'alerte d'équipe pour formaliser ce processus dans votre organisation.
Articles connexes : Créer une procédure d'alerte | 10 signaux d'alerte | Monitoring web PME