Faceted Navigation
La navigation à facettes est le modèle d'interface qui permet aux utilisateurs d'affiner une liste de contenus en combinant filtres et tris : catégorie, étiquette, prix, ordre de tri, etc. Courante sur les pages de catégories d'e-commerce et les pages d'étiquettes ou de filtres de blog, elle améliore l'utilisabilité mais crée l'un des problèmes de SEO technique les plus difficiles : l'explosion d'URL.
La navigation à facettes est le modèle d'interface qui permet aux utilisateurs d'affiner une liste de contenus en combinant filtres et tris : catégorie, étiquette, prix, ordre de tri, etc. Courante sur les pages de catégories d'e-commerce et les pages d'étiquettes ou de filtres de blog, elle améliore l'utilisabilité mais crée l'un des problèmes de SEO technique les plus difficiles : l'explosion d'URL.
Pourquoi c'est important
Trois filtres avec 5 options chacun produisent théoriquement 5³ = 125 combinaisons d'URL. Ajoutez d'autres filtres et vous vous retrouvez avec des dizaines de milliers d'URL. Lorsque Googlebot les explore toutes, vous obtenez :
- Gaspillage de budget d'exploration : les ressources sont dirigées vers des combinaisons de filtres au lieu du contenu réel (les articles eux-mêmes).
- Contenu dupliqué : la même liste d'articles se répète sous des dizaines d'URL de tri et de filtre.
- Contenu pauvre : les combinaisons de filtres avec 0 à 2 résultats s'accumulent dans l'index.
- Capital de liens dilué : les backlinks atterrissent sur des URL chargées de paramètres au lieu des URL canoniques, dispersant les signaux de classement.
Gestion recommandée par Google
1. N'indexer que les facettes à valeur : autorisez les combinaisons ayant une réelle demande de recherche (par exemple « restaurants italiens à Séoul ») et bloquez celles que personne ne recherche (par exemple « trié par prix décroissant »).
2. Normalisation canonique : faites pointer les canoniques des combinaisons sémantiquement équivalentes vers une seule URL représentative, par exemple /blog?tag=seo&sort=latest vers la canonique /blog?tag=seo.
3. Balise meta noindex, follow : utilisez <meta name="robots" content="noindex, follow"> sur les pages de filtres que vous ne souhaitez pas indexer. Cela bloque l'indexation tout en laissant Google suivre les liens internes.
4. Disallow dans robots.txt : pour les modèles d'URL que vous souhaitez voir Googlebot ignorer complètement (?sort=, ?view=, ?utm=), bloquez-les dans robots.txt. Utilisez ceci avec précaution : cela bloque aussi les signaux de classement provenant des liens externes vers ces URL.
5. Plus d'outil de gestion des paramètres d'URL : Google a supprimé l'outil de gestion des paramètres d'URL dans la Search Console en 2022. La gestion des paramètres repose désormais uniquement sur les balises canoniques, les meta robots et le robots.txt.
6. rel="nofollow" sur les liens de filtre : appliquez le nofollow aux liens de filtre afin que les robots ne les suivent pas. Agressif mais efficace.
Ce qu'il faut indexer ou bloquer
Autoriser l'indexation :
- Les pages principales de catégories et d'étiquettes représentant un sujet distinct
- Les combinaisons de filtres ayant une demande de recherche avérée
- Les pages de destination enrichies de descriptions uniques
Bloquer l'indexation :
- Les URL d'ordre de tri (
?sort=price_asc,?sort=date_desc) - Les URL d'éléments par page (
?per_page=20) - Les URL de résultats de recherche interne (
?q=...) - Les pages combinant 3 filtres ou plus
- Les URL avec paramètres de session ou de suivi
Comment diagnostiquer
- Rapport de couverture de la Search Console : vérifiez les URL marquées « Explorée, actuellement non indexée » pour repérer les abus de paramètres.
- Exploration de site avec Ahrefs / Screaming Frog : mesurez le nombre d'URL que votre site expose réellement. Si c'est 10 fois plus que prévu, vous avez un problème de facettes.
- Analyse des fichiers journaux : voyez quels modèles d'URL consomment les requêtes de Googlebot pour diagnostiquer le gaspillage de budget d'exploration.
Sources: