Inchaco do Indice
O inchaco do indice e o estado em que paginas de baixa qualidade, duplicadas ou de baixo valor acabam no indice do Google em tal quantidade que derrubam a avaliacao de qualidade do site inteiro. Isso acontece em blogs, e-commerces e sites corporativos quando as URLs se multiplicam involuntariamente aos milhares, e e um dos assassinos de ranqueamento mais traicoeiros do SEO tecnico.
O inchaco do indice e o estado em que paginas de baixa qualidade, duplicadas ou de baixo valor acabam no indice do Google em tal quantidade que derrubam a avaliacao de qualidade do site inteiro. Isso acontece em blogs, e-commerces e sites corporativos quando as URLs se multiplicam involuntariamente aos milhares, e e um dos assassinos de ranqueamento mais traicoeiros do SEO tecnico.
Por Que Importa
O Google trata a qualidade media de todo o site como um sinal de ranqueamento. Quando 100 posts fortes sao indexados ao lado de 5.000 URLs sem sentido, o Google conclui que "a qualidade media deste site e baixa" - e o ranqueamento cai ate dos seus bons posts. O efeito ficou mais acentuado desde o Helpful Content Update de 2024. O inchaco tambem desperdica orcamento de rastreamento com URLs sem valor, atrasando o rastreamento e a indexacao de novos posts.
Causas Comuns
Parametros de filtro e ordenacao: URLs como ?sort=price_asc ou ?color=red&size=m, vindas da navegacao facetada, acabam indexadas.
Paginas de resultados de busca interna: paginas /search?q=keyword expostas ao Google. O Google recomenda oficialmente aplicar noindex aos resultados de busca interna.
Proliferacao de tags e categorias: centenas de paginas de tag rasas, com apenas 2 ou 3 posts cada.
Duplicacao por paginacao: /blog?page=2, /blog?page=3 indexadas de forma independente como paginas de listagem rasas.
Parametros UTM e de rastreamento: URLs ?utm_source=... tratadas como paginas separadas.
Paginas geradas automaticamente: paginas baseadas em template produzidas em massa por usuario, produto ou regiao, com baixa singularidade.
Residuos de dominio legado: URLs antigas que permanecem sem redirecionamentos 301 apos um redesign.
URLs de dev/staging expostas: subdominios staging. ou dev. publicos sem noindex.
Como Diagnosticar
Relatorio de Cobertura do Search Console: Compare a contagem de "indexadas" com a contagem real de paginas centrais. Uma diferenca de 10x ou mais sinaliza inchaco.
Consulta site:: Execute site:example.com para amostrar quais tipos de URL o Google indexou.
Crawl com Screaming Frog: Rastreie o seu site e compare a contagem de URLs rastreaveis com a contagem de indexadas.
Analise de arquivos de log: Identifique quais padroes de URL estao consumindo as requisicoes do Googlebot.
Como Corrigir
Aplicar noindex: Adicione <meta name="robots" content="noindex"> as paginas que nao devem ser indexadas (resultados de busca, tags rasas, paginas de paginacao mais avancadas). Importante - o noindex exige que a pagina seja rastreavel no robots.txt.
Consolidar canonicas: Aponte as canonicas das URLs com parametros para a URL representativa.
Disallow no robots.txt: Bloqueie de vez o rastreamento de padroes repetitivos (?sort=, ?utm=).
Redirecionamentos 301: Redirecione paginas obsoletas para a pagina-pai que melhor corresponda.
Poda de conteudo: Exclua ou mescle posts sem valor - execute os rotulos "Excluir" da sua auditoria de conteudo.
Normalizacao de parametros: No nivel do servidor, padronize a ordem dos parametros e use caminhos em minusculas para impedir a formacao de URLs duplicadas.
Ressalvas de Execucao
Va aos poucos: Desindexar milhares de paginas de uma vez pode ser interpretado como uma mudanca estrutural e abalar a autoridade geral do site. Faca o lancamento por categoria ou por mes.
Solicite novo rastreamento: Use a Inspecao de URL do Search Console para acelerar as mudancas principais.
Verifique os backlinks: Se uma pagina que voce quer excluir tem backlinks externos, redirecione-a com 301 para nao perder a equity.
Fontes: