SEO

Soft 404

Um soft 404 e o estado em que o servidor retorna HTTP 200 (OK), mas o Google analisa o conteudo da pagina e decide que ela, na pratica, nao existe. A pagina abre no navegador, mas o Google a exclui dos resultados de busca e a marca como "Soft 404" no relatorio de Cobertura do Search Console.

Um soft 404 e o estado em que o servidor retorna HTTP 200 (OK), mas o Google analisa o conteudo da pagina e decide que ela, na pratica, nao existe. A pagina abre no navegador, mas o Google a exclui dos resultados de busca e a marca como "Soft 404" no relatorio de Cobertura do Search Console.

Por Que Importa

Os soft 404 sao uma zona cinzenta - "tecnicamente em ordem, mas desastrosos para o SEO". Donos de sites facilmente presumem que "a pagina carrega, entao esta tudo bem", mas o Google nao indexa essas paginas nem deixa de gastar orcamento de rastreamento com elas, o que prejudica a eficiencia geral de rastreamento e indexacao do dominio. Auditorias de sites grandes com o Ahrefs costumam classificar de 2% a 8% de todas as URLs como soft 404.

Soft 404 vs Hard 404 vs 200

EstadoCodigo HTTPJulgamento do GoogleExperiencia do usuario
Pagina normal200IndexadaConteudo presente
Hard 404404Removida do indicePagina de erro
Soft 404200Excluida do indiceConteudo raso ou vazio

A orientacao explicita do Google: "Se uma pagina nao existe, retorne 404. Se ela existe, sirva conteudo real." O soft 404 e o estado em que nenhuma das duas condicoes e atendida.

Causas Comuns

Paginas de produtos esgotados: Paginas de e-commerce de produtos descontinuados que retornam uma mensagem de uma linha do tipo "indisponivel" com status 200.

Paginas de resultados de busca vazias: A busca interna retornando o texto "nenhum resultado" com status 200.

Conteudo raso: Posts apenas com titulo e quase nenhum corpo, ou somente uma unica imagem.

Redirecionamentos ausentes: Paginas excluidas que retornam o texto "pagina nao encontrada" com status 200 em vez de um 404 real.

Falha na renderizacao de JavaScript: SPAs que entregam um <body> vazio ao Googlebot antes de o JS carregar.

Conteudo bloqueado por login: Paginas que retornam o texto "acesso negado" com status 200.

Proliferacao de templates: Milhares de paginas baseadas em regiao ou categoria com essencialmente o mesmo template e quase nenhum conteudo unico.

Como Diagnosticar

Relatorio de Cobertura do Search Console: A aba "Excluidas" sinaliza diretamente as URLs com "Soft 404".

Inspecao de URL: Compare como o Google renderiza uma URL especifica com o que voce espera.

Screaming Frog: Filtre por Codigos de Resposta para encontrar paginas com status 200 e conteudo raso.

Matriz de codigo HTTP + tamanho do conteudo: Auditorias personalizadas que sinalizam URLs com status 200 e texto do corpo abaixo de um limite.

Como Corrigir

Retorne 404 reais: Se a pagina nao existe, configure o servidor para retornar 404 (ou 410 para remocao permanente). Essa e a correcao mais confiavel.

Redirecionamentos 301: Se a pagina removida tem backlinks valiosos, faca um redirecionamento 301 para a pagina-mae mais relevante para preservar a autoridade.

Reforce o conteudo: Preencha as paginas rasas com valor real. Paginas de produtos esgotados podem incluir recomendacoes de produtos semelhantes.

noindex: Para resultados de busca interna ou combinacoes de filtros rasas, adicione uma meta tag noindex para que o Google nao se preocupe com elas.

Mude para SSR/SSG: Se a causa for o atraso na renderizacao de JS, migre para renderizacao no lado do servidor.

Reduza paginas de template: Consolide ou exclua as paginas rasas geradas automaticamente.

Fontes: