SEO

Sitemap

Un sitemap est un fichier structuré qui fournit aux moteurs de recherche une liste des URL des pages, images, vidéos et autres contenus d'un site web. Il sert de « carte » qui aide les crawlers des moteurs de recherche à explorer et à indexer un site plus efficacement.

Un sitemap est un fichier structuré qui fournit aux moteurs de recherche une liste des URL des pages, images, vidéos et autres contenus d'un site web. Il sert de « carte » qui aide les crawlers des moteurs de recherche à explorer et à indexer un site plus efficacement.

Pourquoi c'est important

Les moteurs de recherche découvrent les pages web en suivant les liens. Cependant, pour les pages nouvellement créées, les pages profondes au maillage interne insuffisant ou les sites de grande envergure comptant des centaines de milliers de pages, les crawlers peuvent avoir du mal à découvrir naturellement chaque page. Un sitemap informe directement les moteurs de recherche de l'existence de ces pages, ce qui améliore l'efficacité du crawl et évite les omissions d'indexation.

Les sitemaps sont particulièrement essentiels dans les cas suivants :

  • Sites de grande envergure comptant 500 pages ou plus
  • Nouveaux sites avec très peu de backlinks externes
  • Sites riches en contenus rich media tels qu'images et vidéos
  • Sites d'actualités où le contenu est fréquemment mis à jour

Un sitemap est une indication de découverte et de recrawl, pas une garantie d'indexation. Google peut explorer une URL issue d'un sitemap et tout de même choisir de ne pas l'indexer en raison de la qualité, de la duplication, de la sélection canonique, de directives noindex ou de problèmes de rendu.

Types

Les sitemaps existent en plusieurs types selon leur finalité :

Sitemap XML : le format le plus basique et le plus répandu. Il structure l'URL et les métadonnées de chaque page à l'aide de balises telles que <url>, <loc> et <lastmod>.

Sitemap d'images : un format qui informe spécifiquement les moteurs de recherche du contenu des images. Utile lorsque vous souhaitez maximiser la visibilité dans la recherche d'images.

Sitemap vidéo : inclut des métadonnées telles que le titre, la description et la durée d'un contenu vidéo pour aider Google à mieux comprendre vos vidéos.

Sitemap d'actualités : un format spécialisé pour les éditeurs d'actualités, qui ne doit inclure que les articles publiés au cours des 2 derniers jours.

Index de sitemaps : lorsqu'un seul fichier sitemap dépasse 50 000 URL ou 50 Mo, plusieurs sitemaps sont regroupés et gérés via un fichier d'index unique.

Sitemap HTML : un sitemap conçu pour les utilisateurs plutôt que pour les moteurs de recherche. Il s'agit d'une page qui rassemble les liens vers les pages clés du site, améliorant la commodité de navigation.

Guide de configuration

Étape 1 — Générer le sitemap

Il existe trois méthodes pour générer un sitemap. Premièrement, utilisez les fonctionnalités ou plugins intégrés du CMS ou du framework (par exemple, Yoast SEO pour WordPress). Deuxièmement, générez-le automatiquement à l'aide d'outils de crawl comme Screaming Frog. Troisièmement, rédigez manuellement le fichier XML, ce qui convient aux sites de petite taille.

Étape 2 — Respecter les règles obligatoires

  • Limitez le nombre d'URL par fichier à 50 000 ou moins et la taille du fichier à 50 Mo ou moins
  • Utilisez l'encodage UTF-8
  • Rédigez les URL en chemins absolus (par exemple, https://example.com/page)
  • N'incluez que les URL canoniques. Excluez les URL qui redirigent ou qui dupliquent des pages
  • N'utilisez <lastmod> que lorsque l'horodatage reflète une modification de contenu significative. Des horodatages inexacts peuvent amener les moteurs de recherche à ignorer le signal.

Étape 3 — Déployer et soumettre

Placez le fichier sitemap dans le répertoire racine du site (par exemple, https://example.com/sitemap.xml). Ajoutez Sitemap: https://example.com/sitemap.xml à votre fichier robots.txt, et soumettez l'URL via le menu « Sitemaps » de la Google Search Console.

Étape 4 — Configurer les mises à jour automatiques

Configurez le sitemap pour qu'il se mette à jour automatiquement chaque fois qu'un contenu est ajouté, modifié ou supprimé. Utilisez des horodatages de modification précis dans la balise <lastmod> pour inciter les moteurs de recherche à prioriser le recrawl des pages modifiées.

Pour les très grands sites, répartissez les URL dans des sitemaps enfants logiques tels que articles, catégories, images ou vidéos et référencez-les depuis un index de sitemaps. Bing et d'autres moteurs peuvent également prendre en charge IndexNow pour une découverte plus rapide, mais cela doit compléter, et non remplacer, un sitemap XML propre et un maillage interne.

Erreurs fréquentes

Inclure des pages noindex dans le sitemap : ajouter au sitemap des pages dotées d'une balise noindex ou bloquées par robots.txt envoie des signaux contradictoires aux moteurs de recherche. N'incluez dans votre sitemap que les pages que vous souhaitez voir indexées.

Inclure des liens cassés (404) : si les URL de pages supprimées subsistent dans le sitemap, la Google Search Console signalera des erreurs « URL envoyée introuvable (404) ». Auditez régulièrement votre sitemap et supprimez les URL non valides.

Inclure des URL redirigées ou non canoniques : les URL du sitemap doivent être des destinations canoniques finales. Soumettre d'anciennes URL, des URL à paramètres de suivi ou des versions canoniques alternatives gaspille le budget de crawl et brouille les diagnostics.

Erreurs de format de date : selon une étude de SEMrush, environ 62 % des erreurs de sitemap XML proviennent de problèmes de format de date. <lastmod> doit respecter le format Datetime du W3C (par exemple, 2026-03-17 ou 2026-03-17T09:00:00+09:00).

Incohérence du format des URL : mélanger https et http, ou www et non-www, peut amener les moteurs de recherche à traiter la même page comme des entités distinctes. Toutes les URL d'un sitemap doivent utiliser un format unique et cohérent.

Générer le sitemap mais ne pas le soumettre : même si vous créez un fichier sitemap, si vous ne le soumettez pas à la Google Search Console ou à Bing Webmaster Tools, les moteurs de recherche peuvent mettre beaucoup de temps à le découvrir.

Sources :

Articles inblog associés

Comment inblog vous aide

inblog génère dynamiquement des sitemaps XML qui reflètent automatiquement la publication et la suppression des articles.