Retour au blog SEO Technique - 8 min

Balise meta robots : noindex, nofollow et les autres directives expliquées

La balise meta robots contrôle ce que Google peut indexer et suivre sur votre site. Un mauvais paramétrage peut déindexer tout votre contenu. Comprendre chaque directive.

La balise <meta name="robots"> est l'un des outils les plus puissants du SEO — et l'un des plus dangereux en cas d'erreur. Elle donne des instructions directes aux moteurs de recherche sur ce qu'ils peuvent ou ne peuvent pas faire avec vos pages. Un seul oubli lors d'une migration peut déindexer des centaines de pages.

Les directives principales expliquées

index / noindex

``html <meta name="robots" content="index"> <!-- Défaut, autorise l'indexation --> <meta name="robots" content="noindex"> <!-- Interdit l'indexation de cette page --> ``

noindex empêche Google d'afficher la page dans ses résultats de recherche. La page peut être crawlée (Googlebot peut visiter), mais son contenu ne sera pas montré dans les SERP.

Quand utiliser noindex :

  • Pages de résultats de recherche interne (?s=requete)
  • Pages de filtres e-commerce sans contenu unique (?couleur=rouge&taille=M)
  • Pages de connexion et d'administration
  • Pages de politique de confidentialité et CGV (si vous ne souhaitez pas les positionner)
  • Pages de staging ou de test

Quand NE PAS utiliser noindex :

  • Vos pages de contenu principales
  • Vos fiches produits
  • Vos articles de blog
  • Votre page d'accueil

follow / nofollow

``html <meta name="robots" content="follow"> <!-- Défaut, Google suit les liens --> <meta name="robots" content="nofollow"> <!-- Google ne suit pas les liens de la page --> ``

nofollow empêche Google de suivre les liens sortants présents sur la page. Il ne transfère pas le PageRank via ces liens.

Important : nofollow en meta robots s'applique à tous les liens de la page. Pour cibler des liens spécifiques, utilisez l'attribut rel="nofollow" sur la balise <a> individuelle.

Combinaisons fréquentes :
``html <meta name="robots" content="noindex, nofollow"> <meta name="robots" content="noindex, follow"> <meta name="robots" content="index, nofollow"> ``

Les directives moins connues mais importantes

nosnippet : Empêche Google d'afficher un extrait de votre page dans les résultats. Utile pour les pages dont vous ne voulez pas que le contenu soit prévisualisé.

noarchive : Empêche Google de créer un cache de votre page (le lien "Page en cache" dans certains résultats).

noimageindex : Empêche l'indexation des images présentes sur la page dans Google Images.

max-snippet:-1 : Contrôle la longueur de l'extrait affiché dans les résultats Google. -1 = pas de limite.

max-image-preview:large : Autorise les grandes vignettes dans les résultats enrichis.

La différence entre meta robots et X-Robots-Tag

Il existe deux façons d'envoyer des directives robots :

Meta robots HTML :
``html <meta name="robots" content="noindex"> ``
Valide uniquement pour les pages HTML.

En-tête HTTP X-Robots-Tag :
`` X-Robots-Tag: noindex ``
Valide pour tout type de ressource (PDF, images, documents Word).

Piège courant : Si un plugin ou une configuration serveur ajoute un X-Robots-Tag: noindex dans les en-têtes HTTP, cette directive prévaut même si votre balise meta dit index. Les en-têtes HTTP sont traités avant le HTML.

Comment vérifier les meta robots de vos pages

Inspection rapide dans Chrome

Ctrl+U pour voir le code source, puis cherchez <meta name="robots". Vérifiez que le content correspond à vos intentions.

Google Search Console

L'outil d'inspection d'URL indique si Google a détecté un noindex et pourquoi la page n'est pas indexée.

Screaming Frog

Il liste toutes les pages avec leurs directives meta robots détectées, permettant un audit en masse. Filtrez par noindex pour identifier toutes les pages exclues de l'index.

Surveiller après les mises à jour

Les plugins de migration, les thèmes et même WordPress core peuvent modifier vos meta robots lors des mises à jour. Intégrez une vérification des meta robots dans votre checklist de maintenance SEO mensuelle.


Articles connexes : Canonical tag | Robots.txt | Sitemap XML

Surveiller mes URL