SEO

Soft 404

Un soft 404 es el estado en el que un servidor devuelve un HTTP 200 (OK), pero Google analiza el contenido de la página y decide que, en la práctica, la página no existe. La página se abre en el navegador, pero Google la excluye de los resultados de búsqueda y la marca como "Soft 404" en el informe de cobertura de Search Console.

Un soft 404 es el estado en el que un servidor devuelve un HTTP 200 (OK), pero Google analiza el contenido de la página y decide que, en la práctica, la página no existe. La página se abre en el navegador, pero Google la excluye de los resultados de búsqueda y la marca como "Soft 404" en el informe de cobertura de Search Console.

Por qué importa

Los soft 404 son una zona gris: "técnicamente correctos, desastrosos para el SEO". Los propietarios de sitios suponen fácilmente que "la página carga, así que está bien", pero Google ni indexa estas páginas ni deja de gastar presupuesto de rastreo en ellas, lo que perjudica la eficiencia general de rastreo e indexación del dominio. Las auditorías de sitios grandes con Ahrefs clasifican habitualmente entre el 2 % y el 8 % de todas las URLs como soft 404.

Soft 404 frente a hard 404 frente a 200

EstadoCódigo HTTPJuicio de GoogleExperiencia del usuario
Página normal200IndexadaContenido presente
Hard 404404Eliminada del índicePágina de error
Soft 404200Excluida del índiceContenido escaso o vacío

La directriz explícita de Google: "Si una página no existe, devuelve un 404. Si existe, sirve contenido real". El soft 404 es el estado en el que no se cumple ninguna de las dos condiciones.

Causas comunes

Páginas de producto agotado: páginas de comercio electrónico de productos descatalogados que devuelven un mensaje de una sola línea de "no disponible" con un estado 200.

Páginas de resultados de búsqueda vacías: la búsqueda interna devuelve un texto de "sin resultados" con un 200.

Contenido escaso: entradas con solo un título y apenas cuerpo, o solo una imagen.

Redirecciones ausentes: páginas eliminadas que devuelven un texto de "página no encontrada" con un 200 en lugar de un 404 real.

Renderizado de JavaScript fallido: SPAs que entregan un <body> vacío a Googlebot antes de que se cargue el JS.

Contenido tras inicio de sesión: páginas que devuelven un texto de "acceso denegado" con un estado 200.

Proliferación de plantillas: miles de páginas por región o categoría con esencialmente la misma plantilla y casi ningún contenido único.

Cómo diagnosticarlo

Informe de cobertura de Search Console: la pestaña "Excluidas" señala directamente las URLs de "Soft 404".

Inspección de URL: compara cómo renderiza Google una URL concreta con lo que esperas.

Screaming Frog: filtra por códigos de respuesta para encontrar páginas con 200 y contenido escaso.

Matriz de código HTTP + longitud de contenido: auditorías personalizadas que señalan las URLs con estado 200 y un texto del cuerpo por debajo de un umbral.

Cómo solucionarlo

Devuelve 404 reales: si la página no existe, configura el servidor para que devuelva un 404 (o un 410 para una eliminación permanente). Es la solución más fiable.

Redirecciones 301: si la página eliminada tiene backlinks valiosos, redirige con 301 a la página principal más relevante para preservar el valor.

Refuerza el contenido: llena las páginas escasas con valor real. Las páginas de producto agotado pueden incluir recomendaciones de productos similares.

noindex: para los resultados de búsqueda interna o las combinaciones de filtros escasas, añade una meta etiqueta noindex para que Google no se moleste.

Cambia a SSR/SSG: si la causa es el retraso del renderizado de JS, pasa al renderizado del lado del servidor.

Reduce las páginas de plantilla: consolida o elimina las páginas escasas generadas automáticamente.

Sources: