Balise meta robots
La balise meta robots (robots meta tag) est la balise <meta name="robots"> insérée dans la zone <head> du HTML : c'est la balise meta qui indique, page par page, comment le moteur de recherche doit indexer une page précise et l'afficher dans les résultats. Elle sert de contenant à des directives individuelles comme noindex, nofollow ou max-snippet, et constitue aussi le concept générique qui regroupe l'ensemble de ces directives.
La balise meta robots (robots meta tag) est la balise <meta name="robots"> insérée dans la zone <head> du HTML : c'est la balise meta qui indique, page par page, comment le moteur de recherche doit indexer une page précise et l'afficher dans les résultats. Elle sert de contenant à des directives individuelles comme noindex, nofollow ou max-snippet, et constitue aussi le concept générique qui regroupe l'ensemble de ces directives.
Pourquoi c'est important
Là où le robots.txt contrôle l'accès des robots à l'échelle du site, la balise meta robots contrôle finement, page par page, l'indexation et la façon dont chaque page s'affiche dans les résultats. Parce qu'elle prend en charge à la fois le « contrôle de l'indexation » — exclure une page de connexion ou de remerciement des résultats (noindex) — et le « contrôle de la forme d'affichage » — limiter la quantité de texte affichée dans l'extrait (max-snippet) —, c'est l'un des outils les plus fréquemment manipulés en SEO technique.
Principales directives
Voici les directives représentatives prises en charge par Google.
| Directive | Signification |
|---|---|
all | Aucune restriction (valeur par défaut) |
noindex | Exclure la page des résultats de recherche |
nofollow | Ne pas suivre les liens présents sur la page |
none | Équivaut à noindex, nofollow |
nosnippet | Ne pas afficher d'extrait texte ni d'aperçu vidéo |
max-snippet:[nombre] | Limiter le nombre maximal de caractères de l'extrait texte |
max-image-preview:[réglage] | Définir la taille de l'aperçu d'image (none·standard·large) |
max-video-preview:[nombre] | Limiter la durée maximale de l'aperçu vidéo (en secondes) |
noimageindex | Ne pas indexer les images de la page |
notranslate | Ne pas proposer de traduction dans les résultats de recherche |
indexifembedded | Autoriser l'indexation d'une page noindex si elle est intégrée via iframe |
unavailable_after:[date] | Exclure la page des résultats après la date indiquée |
Plusieurs directives peuvent être combinées par des virgules.
<meta name="robots" content="noindex, nofollow">
<meta name="robots" content="max-snippet:120, max-image-preview:large">
Méthode de configuration et points de vigilance
name="robots" s'applique à tous les robots des moteurs de recherche, mais on peut aussi cibler un robot précis, comme name="googlebot". En cas de règles contradictoires, c'est la règle la plus restrictive qui s'applique. Par exemple, si max-snippet:50 et nosnippet coexistent, nosnippet l'emporte.
Pour les fichiers non HTML comme les PDF ou les images, où l'on ne peut pas insérer de balise meta, on transmet les mêmes directives via l'en-tête de réponse HTTP X-Robots-Tag.
L'erreur la plus fréquente est de la confondre avec un blocage robots.txt. Si l'on bloque l'exploration par robots.txt, le moteur de recherche ne peut pas ouvrir la page et ne lit donc jamais la balise meta robots elle-même. Une page sur laquelle on souhaite appliquer noindex doit impérativement rester explorable.
Le contrôle des extraits à l'ère de l'IA
À l'origine, nosnippet et max-snippet servaient à ajuster la longueur des extraits dans les résultats de recherche, mais leur sens a changé avec l'essor de la recherche par IA. Dans sa documentation officielle, Google précise que le périmètre de ces directives couvre non seulement la recherche web, les images et Discover, mais aussi les AI Overviews et le mode IA. Déclarer nosnippet bloque jusqu'à l'utilisation du contenu comme entrée directe des réponses de l'IA, et max-snippet limite la quantité que l'IA peut citer.
Autrement dit, la balise meta robots ne se limite plus à « combien de lignes afficher dans les résultats de recherche » : elle est devenue un moyen de contrôler « dans quelle mesure mon contenu sera utilisé dans les réponses de l'IA ». Cela dit, plus la restriction est forte, plus les occasions d'apparaître dans la recherche par IA diminuent aussi ; il faut donc trancher en pesant l'arbitrage entre protection du contenu et visibilité.
Sources :
- Robots Meta Tags Specifications - Google Search Central
- AI Features and Your Website - Google Search Central
Comment inblog vous aide
inblog traite automatiquement les balises meta robots ; aucune configuration particulière n'est donc nécessaire pour une publication d'article ordinaire. Si un article doit être exclu des résultats de recherche, il suffit d'utiliser le réglage noindex propre à chaque article. Pour le reste, les directives fines sont, dans leur valeur par défaut, suffisantes pour la plupart des gestions de blog ; et si l'objectif est d'accroître la visibilité dans la recherche par IA, mieux vaut ne pas imposer de limite sur les extraits.