SEO

Faceted Navigation

La navegación por facetas es el patrón de interfaz que permite a los usuarios acotar una lista de contenido combinando filtros y ordenaciones: categoría, etiqueta, precio, orden de clasificación, etc. Habitual en páginas de categoría de comercio electrónico y en páginas de etiquetas o filtros de blogs, mejora la usabilidad pero crea uno de los problemas más difíciles del SEO técnico: la explosión de URLs.

La navegación por facetas es el patrón de interfaz que permite a los usuarios acotar una lista de contenido combinando filtros y ordenaciones: categoría, etiqueta, precio, orden de clasificación, etc. Habitual en páginas de categoría de comercio electrónico y en páginas de etiquetas o filtros de blogs, mejora la usabilidad pero crea uno de los problemas más difíciles del SEO técnico: la explosión de URLs.

Por qué importa

Tres filtros con 5 opciones cada uno producen teóricamente 5³ = 125 combinaciones de URL. Añade más filtros y estarás ante decenas de miles de URLs. Cuando Googlebot las rastrea todas, obtienes:

  • Desperdicio de presupuesto de rastreo: los recursos se destinan a combinaciones de filtros en lugar de al contenido real (las publicaciones efectivas).
  • Contenido duplicado: la misma lista de publicaciones se repite bajo decenas de URLs de ordenación y filtro.
  • Contenido pobre: las combinaciones de filtros con 0 a 2 resultados se acumulan en el índice.
  • Link equity diluido: los backlinks aterrizan en URLs cargadas de parámetros en lugar de en las canónicas, dispersando las señales de ranking.

Tratamiento recomendado por Google

1. Indexa solo las facetas valiosas: permite las combinaciones con demanda de búsqueda real (p. ej., "restaurantes italianos en Seúl") y bloquea las que nadie busca (p. ej., "ordenado por precio descendente").

2. Normalización canónica: apunta las canónicas de las combinaciones semánticamente equivalentes a una URL representativa, p. ej., /blog?tag=seo&sort=latest a la canónica /blog?tag=seo.

3. Meta etiqueta noindex, follow: usa <meta name="robots" content="noindex, follow"> en las páginas de filtros que no quieras indexar. Bloquea la indexación pero permite que Google siga los enlaces internos.

4. Disallow en robots.txt: para los patrones de URL que quieras que Googlebot omita por completo (?sort=, ?view=, ?utm=), bloquéalos en robots.txt. Úsalo con cuidado, ya que también bloquea las señales de ranking de los enlaces externos a esas URLs.

5. No más herramienta de parámetros de URL: Google retiró la herramienta de parámetros de URL en Search Console en 2022. El tratamiento de parámetros ahora depende únicamente de las etiquetas canónicas, las meta robots y robots.txt.

6. rel="nofollow" en los enlaces de filtros: aplica nofollow a los enlaces de filtros para que los rastreadores no los sigan. Agresivo pero efectivo.

Qué indexar frente a qué bloquear

Permitir indexación:

  • Páginas principales de categoría y etiqueta que representan un tema distinto
  • Combinaciones de filtros con demanda de búsqueda comprobada
  • Páginas de destino enriquecidas con descripciones únicas

Bloquear indexación:

  • URLs de orden de clasificación (?sort=price_asc, ?sort=date_desc)
  • URLs de elementos por página (?per_page=20)
  • URLs de resultados de búsqueda interna (?q=...)
  • Páginas que combinan más de 3 filtros
  • URLs con parámetros de sesión o de seguimiento

Cómo diagnosticar

  • Informe de cobertura de Search Console: revisa las URLs marcadas como "Rastreada: actualmente sin indexar" en busca de abuso de parámetros.
  • Rastreo del sitio con Ahrefs / Screaming Frog: mide cuántas URLs expone realmente tu sitio. Si son 10 veces más de lo que esperabas, tienes un problema de facetas.
  • Análisis de archivos de registro: observa qué patrones de URL están consumiendo las solicitudes de Googlebot para diagnosticar el desperdicio de presupuesto de rastreo.

Sources: