Balise meta robots : noindex, nofollow et les autres directives expliquées
La balise meta robots contrôle ce que Google peut indexer et suivre sur votre site. Un mauvais paramétrage peut déindexer tout votre contenu. Comprendre chaque directive.
La balise <meta name="robots"> est l'un des outils les plus puissants du SEO — et l'un des plus dangereux en cas d'erreur. Elle donne des instructions directes aux moteurs de recherche sur ce qu'ils peuvent ou ne peuvent pas faire avec vos pages. Un seul oubli lors d'une migration peut déindexer des centaines de pages.
Les directives principales expliquées
index / noindex
``html
<meta name="robots" content="index"> <!-- Défaut, autorise l'indexation -->
<meta name="robots" content="noindex"> <!-- Interdit l'indexation de cette page -->
``
noindex empêche Google d'afficher la page dans ses résultats de recherche. La page peut être crawlée (Googlebot peut visiter), mais son contenu ne sera pas montré dans les SERP.
Quand utiliser noindex :
- Pages de résultats de recherche interne (
?s=requete) - Pages de filtres e-commerce sans contenu unique (
?couleur=rouge&taille=M) - Pages de connexion et d'administration
- Pages de politique de confidentialité et CGV (si vous ne souhaitez pas les positionner)
- Pages de staging ou de test
Quand NE PAS utiliser noindex :
- Vos pages de contenu principales
- Vos fiches produits
- Vos articles de blog
- Votre page d'accueil
follow / nofollow
``html
<meta name="robots" content="follow"> <!-- Défaut, Google suit les liens -->
<meta name="robots" content="nofollow"> <!-- Google ne suit pas les liens de la page -->
``
nofollow empêche Google de suivre les liens sortants présents sur la page. Il ne transfère pas le PageRank via ces liens.
Important :
nofollowen meta robots s'applique à tous les liens de la page. Pour cibler des liens spécifiques, utilisez l'attributrel="nofollow"sur la balise<a>individuelle.
Combinaisons fréquentes :
``html
<meta name="robots" content="noindex, nofollow">
<meta name="robots" content="noindex, follow">
<meta name="robots" content="index, nofollow">
``
Les directives moins connues mais importantes
nosnippet : Empêche Google d'afficher un extrait de votre page dans les résultats. Utile pour les pages dont vous ne voulez pas que le contenu soit prévisualisé.
noarchive : Empêche Google de créer un cache de votre page (le lien "Page en cache" dans certains résultats).
noimageindex : Empêche l'indexation des images présentes sur la page dans Google Images.
max-snippet:-1 : Contrôle la longueur de l'extrait affiché dans les résultats Google. -1 = pas de limite.
max-image-preview:large : Autorise les grandes vignettes dans les résultats enrichis.
La différence entre meta robots et X-Robots-Tag
Il existe deux façons d'envoyer des directives robots :
Meta robots HTML :
``html
<meta name="robots" content="noindex">
``
Valide uniquement pour les pages HTML.
En-tête HTTP X-Robots-Tag :
``
X-Robots-Tag: noindex
``
Valide pour tout type de ressource (PDF, images, documents Word).
Piège courant : Si un plugin ou une configuration serveur ajoute un
X-Robots-Tag: noindexdans les en-têtes HTTP, cette directive prévaut même si votre balise meta ditindex. Les en-têtes HTTP sont traités avant le HTML.
Comment vérifier les meta robots de vos pages
Inspection rapide dans Chrome
Ctrl+U pour voir le code source, puis cherchez <meta name="robots". Vérifiez que le content correspond à vos intentions.
Google Search Console
L'outil d'inspection d'URL indique si Google a détecté un noindex et pourquoi la page n'est pas indexée.
Screaming Frog
Il liste toutes les pages avec leurs directives meta robots détectées, permettant un audit en masse. Filtrez par noindex pour identifier toutes les pages exclues de l'index.
Surveiller après les mises à jour
Les plugins de migration, les thèmes et même WordPress core peuvent modifier vos meta robots lors des mises à jour. Intégrez une vérification des meta robots dans votre checklist de maintenance SEO mensuelle.
Articles connexes : Canonical tag | Robots.txt | Sitemap XML