SEO

Inchaco do Indice

O inchaco do indice e o estado em que paginas de baixa qualidade, duplicadas ou de baixo valor acabam no indice do Google em tal quantidade que derrubam a avaliacao de qualidade do site inteiro. Isso acontece em blogs, e-commerces e sites corporativos quando as URLs se multiplicam involuntariamente aos milhares, e e um dos assassinos de ranqueamento mais traicoeiros do SEO tecnico.

O inchaco do indice e o estado em que paginas de baixa qualidade, duplicadas ou de baixo valor acabam no indice do Google em tal quantidade que derrubam a avaliacao de qualidade do site inteiro. Isso acontece em blogs, e-commerces e sites corporativos quando as URLs se multiplicam involuntariamente aos milhares, e e um dos assassinos de ranqueamento mais traicoeiros do SEO tecnico.

Por Que Importa

O Google trata a qualidade media de todo o site como um sinal de ranqueamento. Quando 100 posts fortes sao indexados ao lado de 5.000 URLs sem sentido, o Google conclui que "a qualidade media deste site e baixa" - e o ranqueamento cai ate dos seus bons posts. O efeito ficou mais acentuado desde o Helpful Content Update de 2024. O inchaco tambem desperdica orcamento de rastreamento com URLs sem valor, atrasando o rastreamento e a indexacao de novos posts.

Causas Comuns

Parametros de filtro e ordenacao: URLs como ?sort=price_asc ou ?color=red&size=m, vindas da navegacao facetada, acabam indexadas.

Paginas de resultados de busca interna: paginas /search?q=keyword expostas ao Google. O Google recomenda oficialmente aplicar noindex aos resultados de busca interna.

Proliferacao de tags e categorias: centenas de paginas de tag rasas, com apenas 2 ou 3 posts cada.

Duplicacao por paginacao: /blog?page=2, /blog?page=3 indexadas de forma independente como paginas de listagem rasas.

Parametros UTM e de rastreamento: URLs ?utm_source=... tratadas como paginas separadas.

Paginas geradas automaticamente: paginas baseadas em template produzidas em massa por usuario, produto ou regiao, com baixa singularidade.

Residuos de dominio legado: URLs antigas que permanecem sem redirecionamentos 301 apos um redesign.

URLs de dev/staging expostas: subdominios staging. ou dev. publicos sem noindex.

Como Diagnosticar

Relatorio de Cobertura do Search Console: Compare a contagem de "indexadas" com a contagem real de paginas centrais. Uma diferenca de 10x ou mais sinaliza inchaco.

Consulta site:: Execute site:example.com para amostrar quais tipos de URL o Google indexou.

Crawl com Screaming Frog: Rastreie o seu site e compare a contagem de URLs rastreaveis com a contagem de indexadas.

Analise de arquivos de log: Identifique quais padroes de URL estao consumindo as requisicoes do Googlebot.

Como Corrigir

Aplicar noindex: Adicione <meta name="robots" content="noindex"> as paginas que nao devem ser indexadas (resultados de busca, tags rasas, paginas de paginacao mais avancadas). Importante - o noindex exige que a pagina seja rastreavel no robots.txt.

Consolidar canonicas: Aponte as canonicas das URLs com parametros para a URL representativa.

Disallow no robots.txt: Bloqueie de vez o rastreamento de padroes repetitivos (?sort=, ?utm=).

Redirecionamentos 301: Redirecione paginas obsoletas para a pagina-pai que melhor corresponda.

Poda de conteudo: Exclua ou mescle posts sem valor - execute os rotulos "Excluir" da sua auditoria de conteudo.

Normalizacao de parametros: No nivel do servidor, padronize a ordem dos parametros e use caminhos em minusculas para impedir a formacao de URLs duplicadas.

Ressalvas de Execucao

Va aos poucos: Desindexar milhares de paginas de uma vez pode ser interpretado como uma mudanca estrutural e abalar a autoridade geral do site. Faca o lancamento por categoria ou por mes.

Solicite novo rastreamento: Use a Inspecao de URL do Search Console para acelerar as mudancas principais.

Verifique os backlinks: Se uma pagina que voce quer excluir tem backlinks externos, redirecione-a com 301 para nao perder a equity.

Fontes: