SEO

Noindex

Noindex es una directiva de la meta robots que indica a los motores de búsqueda que no incluyan una página concreta en los resultados de búsqueda. Puede establecerse mediante una etiqueta HTML <meta> o una cabecera de respuesta HTTP (X-Robots-Tag), lo que impide que la página aparezca en las páginas de resultados de los motores de búsqueda (SERP) como Google y Bing.

Noindex es una directiva de la meta robots que indica a los motores de búsqueda que no incluyan una página concreta en los resultados de búsqueda. Puede establecerse mediante una etiqueta HTML <meta> o una cabecera de respuesta HTTP (X-Robots-Tag), lo que impide que la página aparezca en las páginas de resultados de los motores de búsqueda (SERP) como Google y Bing.

Por qué importa

Los motores de búsqueda intentan rastrear e indexar todas las páginas de un sitio web. Sin embargo, no todas las páginas merecen aparecer en los resultados de búsqueda. Si se indexan páginas como las de inicio de sesión, las de resultados de búsqueda interna, las de agradecimiento o las de entornos de staging, se malgasta el presupuesto de rastreo, surgen problemas de contenido duplicado y la evaluación general de la calidad de búsqueda del sitio puede degradarse. Usar noindex correctamente te permite indicar a los motores de búsqueda que concentren los recursos de rastreo en las páginas que aportan un valor real.

Cómo configurarlo

  1. Método de la meta tag HTML

Añade la siguiente etiqueta a la sección <head> de la página:

<meta name="robots" content="noindex">

También puedes dirigirte a motores de búsqueda específicos. Por ejemplo, para aplicar noindex solo a Google, cambia el atributo name a googlebot:

<meta name="googlebot" content="noindex">

Para bloquear también el rastreo de enlaces, usa nofollow junto con él:

<meta name="robots" content="noindex, nofollow">
  1. Método de la cabecera HTTP (X-Robots-Tag)

Para recursos que no son HTML (PDF, imágenes, etc.) donde no se pueden insertar meta tags, establece la directiva en la cabecera de respuesta del servidor:

X-Robots-Tag: noindex

En frameworks como Next.js, puedes establecer las cabeceras de respuesta directamente dentro de las rutas de API o de getServerSideProps.

Cuándo usarlo

Se recomienda aplicar noindex a los siguientes tipos de páginas:

  • Páginas de resultados de búsqueda interna: las páginas dinámicas generadas por la función de búsqueda del sitio pueden ser percibidas como contenido duplicado por los motores de búsqueda.
  • Páginas de inicio de sesión, registro y perfil: páginas que contienen información personal y que no necesitan exponerse en los resultados de búsqueda.
  • Páginas de agradecimiento: las páginas de confirmación que se muestran tras enviar un formulario no tienen valor de tráfico de búsqueda.
  • Entornos de staging y de pruebas: evita que los sitios de desarrollo se indexen accidentalmente. Sin embargo, asegúrate de eliminar el noindex al desplegar a producción.
  • Páginas con contenido duplicado: no obstante, si la relación entre una página canónica y una duplicada es clara, una etiqueta canonical puede ser una solución más adecuada.
  • Páginas solo para administradores: los paneles de control, los paneles de administración y páginas similares no necesitan exposición en las búsquedas.

Diferencias entre Noindex y Disallow

Noindex y la directiva Disallow de robots.txt se confunden con frecuencia, pero su comportamiento es fundamentalmente distinto.

Atributonoindex (meta tag)Disallow (robots.txt)
FunciónExcluye la página de los resultados de búsquedaBloquea por completo el acceso del rastreador a la página
IndexaciónPermite el rastreo pero bloquea la indexaciónBloquea el rastreo, pero la página aún puede indexarse a través de enlaces externos
Autoridad de enlaceEl valor del enlace (link equity) de la página aún puede transmitirseLos rastreadores no pueden leer la página, por lo que el valor del enlace no puede transferirse
AlcanceControl preciso a nivel de página individualControl por lotes a nivel de directorio o patrón de URL

La advertencia más crítica es que no debes usar ambos simultáneamente. Si el rastreo se bloquea mediante robots.txt, el motor de búsqueda no puede leer la etiqueta noindex de la página, lo que provoca que la directiva noindex se ignore, y la página puede permanecer en los resultados de búsqueda. Para excluir de forma fiable una página de los resultados de búsqueda, permite el rastreo mientras usas la meta tag noindex.

Sources:

Publicaciones relacionadas de inblog

Cómo ayuda inblog

inblog te permite aplicar noindex a entradas individuales o a páginas de etiquetas para evitar que se indexen páginas no deseadas.