Noindex
Noindex es una directiva de la meta robots que indica a los motores de búsqueda que no incluyan una página concreta en los resultados de búsqueda. Puede establecerse mediante una etiqueta HTML <meta> o una cabecera de respuesta HTTP (X-Robots-Tag), lo que impide que la página aparezca en las páginas de resultados de los motores de búsqueda (SERP) como Google y Bing.
Noindex es una directiva de la meta robots que indica a los motores de búsqueda que no incluyan una página concreta en los resultados de búsqueda. Puede establecerse mediante una etiqueta HTML <meta> o una cabecera de respuesta HTTP (X-Robots-Tag), lo que impide que la página aparezca en las páginas de resultados de los motores de búsqueda (SERP) como Google y Bing.
Por qué importa
Los motores de búsqueda intentan rastrear e indexar todas las páginas de un sitio web. Sin embargo, no todas las páginas merecen aparecer en los resultados de búsqueda. Si se indexan páginas como las de inicio de sesión, las de resultados de búsqueda interna, las de agradecimiento o las de entornos de staging, se malgasta el presupuesto de rastreo, surgen problemas de contenido duplicado y la evaluación general de la calidad de búsqueda del sitio puede degradarse. Usar noindex correctamente te permite indicar a los motores de búsqueda que concentren los recursos de rastreo en las páginas que aportan un valor real.
Cómo configurarlo
- Método de la meta tag HTML
Añade la siguiente etiqueta a la sección <head> de la página:
<meta name="robots" content="noindex">
También puedes dirigirte a motores de búsqueda específicos. Por ejemplo, para aplicar noindex solo a Google, cambia el atributo name a googlebot:
<meta name="googlebot" content="noindex">
Para bloquear también el rastreo de enlaces, usa nofollow junto con él:
<meta name="robots" content="noindex, nofollow">
- Método de la cabecera HTTP (X-Robots-Tag)
Para recursos que no son HTML (PDF, imágenes, etc.) donde no se pueden insertar meta tags, establece la directiva en la cabecera de respuesta del servidor:
X-Robots-Tag: noindex
En frameworks como Next.js, puedes establecer las cabeceras de respuesta directamente dentro de las rutas de API o de getServerSideProps.
Cuándo usarlo
Se recomienda aplicar noindex a los siguientes tipos de páginas:
- Páginas de resultados de búsqueda interna: las páginas dinámicas generadas por la función de búsqueda del sitio pueden ser percibidas como contenido duplicado por los motores de búsqueda.
- Páginas de inicio de sesión, registro y perfil: páginas que contienen información personal y que no necesitan exponerse en los resultados de búsqueda.
- Páginas de agradecimiento: las páginas de confirmación que se muestran tras enviar un formulario no tienen valor de tráfico de búsqueda.
- Entornos de staging y de pruebas: evita que los sitios de desarrollo se indexen accidentalmente. Sin embargo, asegúrate de eliminar el noindex al desplegar a producción.
- Páginas con contenido duplicado: no obstante, si la relación entre una página canónica y una duplicada es clara, una etiqueta
canonicalpuede ser una solución más adecuada. - Páginas solo para administradores: los paneles de control, los paneles de administración y páginas similares no necesitan exposición en las búsquedas.
Diferencias entre Noindex y Disallow
Noindex y la directiva Disallow de robots.txt se confunden con frecuencia, pero su comportamiento es fundamentalmente distinto.
| Atributo | noindex (meta tag) | Disallow (robots.txt) |
|---|---|---|
| Función | Excluye la página de los resultados de búsqueda | Bloquea por completo el acceso del rastreador a la página |
| Indexación | Permite el rastreo pero bloquea la indexación | Bloquea el rastreo, pero la página aún puede indexarse a través de enlaces externos |
| Autoridad de enlace | El valor del enlace (link equity) de la página aún puede transmitirse | Los rastreadores no pueden leer la página, por lo que el valor del enlace no puede transferirse |
| Alcance | Control preciso a nivel de página individual | Control por lotes a nivel de directorio o patrón de URL |
La advertencia más crítica es que no debes usar ambos simultáneamente. Si el rastreo se bloquea mediante robots.txt, el motor de búsqueda no puede leer la etiqueta noindex de la página, lo que provoca que la directiva noindex se ignore, y la página puede permanecer en los resultados de búsqueda. Para excluir de forma fiable una página de los resultados de búsqueda, permite el rastreo mientras usas la meta tag noindex.
Sources:
- Bloquear la indexación de búsqueda con noindex - Google Search Central
- ¿Para qué se usa noindex? Una visión general y mejores prácticas - Semrush
- ¿Qué es una etiqueta noindex? - Ahrefs
Publicaciones relacionadas de inblog
Cómo ayuda inblog
inblog te permite aplicar noindex a entradas individuales o a páginas de etiquetas para evitar que se indexen páginas no deseadas.