Indexabilidad
La indexabilidad (Indexability) es el estado en que un buscador puede analizar una página que ha rastreado, guardarla en el índice (la base de datos de indexación) y mostrarla en los resultados de búsqueda. Si la rastreabilidad pregunta "¿puede el buscador acceder a esta página?", la indexabilidad es el concepto que pregunta "¿reúne la página a la que se ha accedido las condiciones para ser indexada?".
La indexabilidad (Indexability) es el estado en que un buscador puede analizar una página que ha rastreado, guardarla en el índice (la base de datos de indexación) y mostrarla en los resultados de búsqueda. Si la rastreabilidad pregunta "¿puede el buscador acceder a esta página?", la indexabilidad es el concepto que pregunta "¿reúne la página a la que se ha accedido las condiciones para ser indexada?".
Por qué importa
Que una página se haya rastreado no garantiza que se indexe. La propia documentación oficial de Google indica que "la indexación no está garantizada y no todas las páginas que Google procesa se indexan". Como una página no indexada no puede aparecer en los resultados de búsqueda por bueno que sea su contenido, la indexabilidad es una condición necesaria para la presencia en la búsqueda y el ranking.
En especial, cuanto mayor es la escala de un sitio, más fácil es que aumenten las páginas abandonadas en el estado "Rastreada: actualmente sin indexar". Mientras que los problemas de rastreabilidad son relativamente fáciles de detectar porque se bloquea el propio acceso del bot, los problemas de indexabilidad pasan desapercibidos a menudo, ya que la página se abre con normalidad pero solo no aparece en la búsqueda.
Diferencia con la rastreabilidad
| Distinción | Rastreabilidad | Indexabilidad |
|---|---|---|
| Pregunta | ¿Puede el buscador acceder a la página y leerla? | ¿Puede guardarse en el índice y mostrarse la página leída? |
| Factores de bloqueo | Bloqueo en robots.txt, errores de servidor, enlaces rotos | noindex, canonical, códigos de estado 4xx·5xx, contenido de baja calidad |
| Relación | Condición previa | Se evalúa tras un rastreo exitoso |
Ambos conceptos guardan una relación secuencial. Una página que no se ha rastreado ni siquiera llega a ser objeto de la evaluación de indexación, y solo las páginas rastreadas con éxito pasan a la fase de indexabilidad.
Factores que determinan la indexabilidad
- Directiva noindex: si la página tiene una metaetiqueta noindex o una cabecera X-Robots-Tag, el buscador la excluye del índice.
- Señal canonical: si la URL canónica apunta a otra página, esa página se clasifica como "página alternativa" y queda fuera de la indexación. Google agrupa las páginas similares e indexa solo una página representativa por clúster.
- Código de estado HTTP: solo pueden indexarse las páginas que devuelven una respuesta 200. Los errores 404·410·5xx, los soft 404 y las URL que redirigen quedan excluidos del índice.
- Relación con robots.txt: el bloqueo en robots.txt solo impide el rastreo, no bloquea directamente la indexación. Al contrario, una página bloqueada no puede leer la etiqueta noindex, por lo que puede producirse el efecto secundario de que la URL se indexe solo con enlaces externos.
- Calidad del contenido: aunque una página sea técnicamente indexable, si el contenido es escaso o duplicado, Google puede no indexarla. Es una causa frecuente del estado "Rastreada: actualmente sin indexar".
Cómo revisarla
El informe de Indexación de páginas (Page Indexing) de Google Search Console clasifica por motivos las páginas no indexadas. Según el motivo —"Excluida por la etiqueta noindex", "Página alternativa con la etiqueta canónica adecuada", "Rastreada: actualmente sin indexar", etc.— puedes determinar si se trata de una exclusión intencionada o de un problema. Para URL concretas, comprueba con la herramienta de inspección de URL el estado de indexación y la canónica que ha elegido Google.
Sources:
- In-depth guide to how Google Search works - Google Search Central
- Page Indexing report - Search Console Help
- Indexability: Make sure search engines can actually find and rank you - Search Engine Land
Cómo ayuda inblog
inblog procesa de forma automática los fundamentos para que los posts publicados reúnan las condiciones de indexación. La respuesta 200 correcta, la etiqueta canonical por post y la generación automática de sitemap vienen de serie, y los posts que quieras dejar fuera del índice pueden excluirse con la configuración noindex. Tras la publicación, conviene adoptar el hábito de comprobar periódicamente en el informe de indexación de páginas de Search Console si realmente se han indexado.