Soft 404
Um soft 404 e o estado em que o servidor retorna HTTP 200 (OK), mas o Google analisa o conteudo da pagina e decide que ela, na pratica, nao existe. A pagina abre no navegador, mas o Google a exclui dos resultados de busca e a marca como "Soft 404" no relatorio de Cobertura do Search Console.
Um soft 404 e o estado em que o servidor retorna HTTP 200 (OK), mas o Google analisa o conteudo da pagina e decide que ela, na pratica, nao existe. A pagina abre no navegador, mas o Google a exclui dos resultados de busca e a marca como "Soft 404" no relatorio de Cobertura do Search Console.
Por Que Importa
Os soft 404 sao uma zona cinzenta - "tecnicamente em ordem, mas desastrosos para o SEO". Donos de sites facilmente presumem que "a pagina carrega, entao esta tudo bem", mas o Google nao indexa essas paginas nem deixa de gastar orcamento de rastreamento com elas, o que prejudica a eficiencia geral de rastreamento e indexacao do dominio. Auditorias de sites grandes com o Ahrefs costumam classificar de 2% a 8% de todas as URLs como soft 404.
Soft 404 vs Hard 404 vs 200
| Estado | Codigo HTTP | Julgamento do Google | Experiencia do usuario |
|---|---|---|---|
| Pagina normal | 200 | Indexada | Conteudo presente |
| Hard 404 | 404 | Removida do indice | Pagina de erro |
| Soft 404 | 200 | Excluida do indice | Conteudo raso ou vazio |
A orientacao explicita do Google: "Se uma pagina nao existe, retorne 404. Se ela existe, sirva conteudo real." O soft 404 e o estado em que nenhuma das duas condicoes e atendida.
Causas Comuns
Paginas de produtos esgotados: Paginas de e-commerce de produtos descontinuados que retornam uma mensagem de uma linha do tipo "indisponivel" com status 200.
Paginas de resultados de busca vazias: A busca interna retornando o texto "nenhum resultado" com status 200.
Conteudo raso: Posts apenas com titulo e quase nenhum corpo, ou somente uma unica imagem.
Redirecionamentos ausentes: Paginas excluidas que retornam o texto "pagina nao encontrada" com status 200 em vez de um 404 real.
Falha na renderizacao de JavaScript: SPAs que entregam um <body> vazio ao Googlebot antes de o JS carregar.
Conteudo bloqueado por login: Paginas que retornam o texto "acesso negado" com status 200.
Proliferacao de templates: Milhares de paginas baseadas em regiao ou categoria com essencialmente o mesmo template e quase nenhum conteudo unico.
Como Diagnosticar
Relatorio de Cobertura do Search Console: A aba "Excluidas" sinaliza diretamente as URLs com "Soft 404".
Inspecao de URL: Compare como o Google renderiza uma URL especifica com o que voce espera.
Screaming Frog: Filtre por Codigos de Resposta para encontrar paginas com status 200 e conteudo raso.
Matriz de codigo HTTP + tamanho do conteudo: Auditorias personalizadas que sinalizam URLs com status 200 e texto do corpo abaixo de um limite.
Como Corrigir
Retorne 404 reais: Se a pagina nao existe, configure o servidor para retornar 404 (ou 410 para remocao permanente). Essa e a correcao mais confiavel.
Redirecionamentos 301: Se a pagina removida tem backlinks valiosos, faca um redirecionamento 301 para a pagina-mae mais relevante para preservar a autoridade.
Reforce o conteudo: Preencha as paginas rasas com valor real. Paginas de produtos esgotados podem incluir recomendacoes de produtos semelhantes.
noindex: Para resultados de busca interna ou combinacoes de filtros rasas, adicione uma meta tag noindex para que o Google nao se preocupe com elas.
Mude para SSR/SSG: Se a causa for o atraso na renderizacao de JS, migre para renderizacao no lado do servidor.
Reduza paginas de template: Consolide ou exclua as paginas rasas geradas automaticamente.
Fontes: