SEO

Indexabilité

L'indexabilité (Indexability) désigne l'état dans lequel un moteur de recherche peut analyser une page explorée, la stocker dans son index (la base de données d'indexation) et l'afficher dans les résultats de recherche. Là où l'explorabilité pose la question « le moteur de recherche peut-il accéder à cette page ? », l'indexabilité pose celle de « la page atteinte a-t-elle vocation à être indexée ? ».

L'indexabilité (Indexability) désigne l'état dans lequel un moteur de recherche peut analyser une page explorée, la stocker dans son index (la base de données d'indexation) et l'afficher dans les résultats de recherche. Là où l'explorabilité pose la question « le moteur de recherche peut-il accéder à cette page ? », l'indexabilité pose celle de « la page atteinte a-t-elle vocation à être indexée ? ».

Pourquoi c'est important

Être explorée ne garantit pas d'être indexée. La documentation officielle de Google précise elle aussi que « l'indexation n'est pas garantie et que toutes les pages traitées par Google ne sont pas indexées ». Une page non indexée ne peut apparaître dans les résultats de recherche, aussi bon soit son contenu : l'indexabilité est donc une condition nécessaire de la visibilité et du classement.

À mesure que la taille d'un site augmente, il devient particulièrement facile de laisser des pages bloquées dans l'état « Explorée, actuellement non indexée ». Les problèmes d'explorabilité sont relativement faciles à repérer puisque l'accès du bot est lui-même bloqué, tandis que les problèmes d'indexabilité passent souvent inaperçus : la page s'ouvre normalement, mais reste invisible dans la seule recherche.

Différence avec l'explorabilité

AspectExplorabilitéIndexabilité
QuestionLe moteur de recherche peut-il accéder à la page et la lire ?La page lue peut-elle être stockée dans l'index et affichée ?
Facteurs de blocageBlocage robots.txt, erreurs serveur, liens brisésnoindex, canonical, codes 4xx·5xx, contenu de faible qualité
RelationCondition préalableÉvaluée après une exploration réussie

Les deux notions sont séquentielles. Une page non explorée n'entre même pas dans le périmètre de l'évaluation d'indexation ; seules les pages explorées avec succès passent à l'étape de l'indexabilité.

Les facteurs qui déterminent l'indexabilité

  1. Directives noindex : si une page porte une balise meta noindex ou un en-tête X-Robots-Tag, le moteur de recherche l'exclut de l'index.
  2. Signaux canonical : si l'URL canonique pointe vers une autre page, celle-ci est classée comme « page alternative » et écartée de l'indexation. Google regroupe les pages similaires et n'indexe qu'une seule page représentative par cluster.
  3. Codes de statut HTTP : seules les pages renvoyant une réponse 200 peuvent être indexées. Les erreurs 404·410·5xx, les soft 404 et les URL qui redirigent sont exclues de l'index.
  4. Relation avec robots.txt : un blocage robots.txt empêche l'exploration, mais n'empêche pas directement l'indexation. Pire, une page bloquée ne peut plus voir sa balise noindex lue, ce qui peut provoquer l'effet indésirable d'une URL indexée par les seuls liens externes.
  5. Qualité du contenu : même une page techniquement indexable peut ne pas être indexée par Google si son contenu est mince ou dupliqué. C'est une cause fréquente de l'état « Explorée, actuellement non indexée ».

Comment vérifier

Le rapport d'indexation des pages (Page Indexing) de la Google Search Console classe par motif les pages non indexées. Selon le motif — « Exclue par la balise "noindex" », « Page alternative avec balise canonique correcte », « Explorée, actuellement non indexée », etc. —, vous pouvez déterminer s'il s'agit d'une exclusion volontaire ou d'un problème. Pour une URL précise, l'outil d'inspection des URL permet de vérifier l'état d'indexation et la page canonique retenue par Google.

Sources :

Comment inblog vous aide

inblog prend automatiquement en charge les fondamentaux pour que les articles publiés aient vocation à être indexés. Réponse 200 correcte, balise canonical par article et génération automatique du sitemap sont fournies par défaut, et les articles que vous souhaitez exclure de l'index peuvent l'être via le réglage noindex. Après publication, prenez l'habitude de vérifier régulièrement l'indexation réelle dans le rapport d'indexation des pages de la Search Console.