SEO

Balise meta robots

La balise meta robots (robots meta tag) est la balise <meta name="robots"> insérée dans la zone <head> du HTML : c'est la balise meta qui indique, page par page, comment le moteur de recherche doit indexer une page précise et l'afficher dans les résultats. Elle sert de contenant à des directives individuelles comme noindex, nofollow ou max-snippet, et constitue aussi le concept générique qui regroupe l'ensemble de ces directives.

La balise meta robots (robots meta tag) est la balise <meta name="robots"> insérée dans la zone <head> du HTML : c'est la balise meta qui indique, page par page, comment le moteur de recherche doit indexer une page précise et l'afficher dans les résultats. Elle sert de contenant à des directives individuelles comme noindex, nofollow ou max-snippet, et constitue aussi le concept générique qui regroupe l'ensemble de ces directives.

Pourquoi c'est important

Là où le robots.txt contrôle l'accès des robots à l'échelle du site, la balise meta robots contrôle finement, page par page, l'indexation et la façon dont chaque page s'affiche dans les résultats. Parce qu'elle prend en charge à la fois le « contrôle de l'indexation » — exclure une page de connexion ou de remerciement des résultats (noindex) — et le « contrôle de la forme d'affichage » — limiter la quantité de texte affichée dans l'extrait (max-snippet) —, c'est l'un des outils les plus fréquemment manipulés en SEO technique.

Principales directives

Voici les directives représentatives prises en charge par Google.

DirectiveSignification
allAucune restriction (valeur par défaut)
noindexExclure la page des résultats de recherche
nofollowNe pas suivre les liens présents sur la page
noneÉquivaut à noindex, nofollow
nosnippetNe pas afficher d'extrait texte ni d'aperçu vidéo
max-snippet:[nombre]Limiter le nombre maximal de caractères de l'extrait texte
max-image-preview:[réglage]Définir la taille de l'aperçu d'image (none·standard·large)
max-video-preview:[nombre]Limiter la durée maximale de l'aperçu vidéo (en secondes)
noimageindexNe pas indexer les images de la page
notranslateNe pas proposer de traduction dans les résultats de recherche
indexifembeddedAutoriser l'indexation d'une page noindex si elle est intégrée via iframe
unavailable_after:[date]Exclure la page des résultats après la date indiquée

Plusieurs directives peuvent être combinées par des virgules.

<meta name="robots" content="noindex, nofollow">
<meta name="robots" content="max-snippet:120, max-image-preview:large">

Méthode de configuration et points de vigilance

name="robots" s'applique à tous les robots des moteurs de recherche, mais on peut aussi cibler un robot précis, comme name="googlebot". En cas de règles contradictoires, c'est la règle la plus restrictive qui s'applique. Par exemple, si max-snippet:50 et nosnippet coexistent, nosnippet l'emporte.

Pour les fichiers non HTML comme les PDF ou les images, où l'on ne peut pas insérer de balise meta, on transmet les mêmes directives via l'en-tête de réponse HTTP X-Robots-Tag.

L'erreur la plus fréquente est de la confondre avec un blocage robots.txt. Si l'on bloque l'exploration par robots.txt, le moteur de recherche ne peut pas ouvrir la page et ne lit donc jamais la balise meta robots elle-même. Une page sur laquelle on souhaite appliquer noindex doit impérativement rester explorable.

Le contrôle des extraits à l'ère de l'IA

À l'origine, nosnippet et max-snippet servaient à ajuster la longueur des extraits dans les résultats de recherche, mais leur sens a changé avec l'essor de la recherche par IA. Dans sa documentation officielle, Google précise que le périmètre de ces directives couvre non seulement la recherche web, les images et Discover, mais aussi les AI Overviews et le mode IA. Déclarer nosnippet bloque jusqu'à l'utilisation du contenu comme entrée directe des réponses de l'IA, et max-snippet limite la quantité que l'IA peut citer.

Autrement dit, la balise meta robots ne se limite plus à « combien de lignes afficher dans les résultats de recherche » : elle est devenue un moyen de contrôler « dans quelle mesure mon contenu sera utilisé dans les réponses de l'IA ». Cela dit, plus la restriction est forte, plus les occasions d'apparaître dans la recherche par IA diminuent aussi ; il faut donc trancher en pesant l'arbitrage entre protection du contenu et visibilité.

Sources :

Comment inblog vous aide

inblog traite automatiquement les balises meta robots ; aucune configuration particulière n'est donc nécessaire pour une publication d'article ordinaire. Si un article doit être exclu des résultats de recherche, il suffit d'utiliser le réglage noindex propre à chaque article. Pour le reste, les directives fines sont, dans leur valeur par défaut, suffisantes pour la plupart des gestions de blog ; et si l'objectif est d'accroître la visibilité dans la recherche par IA, mieux vaut ne pas imposer de limite sur les extraits.