SEO

Indexabilidade

Indexabilidade (Indexability) é o estado em que um mecanismo de busca consegue analisar uma página rastreada, armazená-la no índice (banco de dados de indexação) e exibi-la nos resultados de busca. Se a rastreabilidade pergunta "o mecanismo de busca consegue acessar esta página?", a indexabilidade é o conceito que pergunta "a página acessada está apta a ser indexada?".

Indexabilidade (Indexability) é o estado em que um mecanismo de busca consegue analisar uma página rastreada, armazená-la no índice (banco de dados de indexação) e exibi-la nos resultados de busca. Se a rastreabilidade pergunta "o mecanismo de busca consegue acessar esta página?", a indexabilidade é o conceito que pergunta "a página acessada está apta a ser indexada?".

Por Que Importa

O fato de ter sido rastreada não garante a indexação. A própria documentação oficial do Google afirma que "a indexação não é garantida e nem toda página processada pelo Google é indexada". Uma página não indexada não pode aparecer nos resultados de busca por melhor que seja o conteúdo, então a indexabilidade é condição necessária para a exibição e o ranqueamento na busca.

Em especial, quanto maior o site, mais fácil é acumular páginas deixadas no estado "Rastreada, mas não indexada no momento". Enquanto os problemas de rastreabilidade são relativamente fáceis de detectar, pois o próprio acesso do bot fica bloqueado, os problemas de indexabilidade muitas vezes passam despercebidos, porque a página abre normalmente e só não aparece na busca.

Diferença em Relação à Rastreabilidade

AspectoRastreabilidadeIndexabilidade
PerguntaO mecanismo de busca consegue acessar e ler a página?A página lida pode ser armazenada no índice e exibida?
Fatores de bloqueioBloqueio no robots.txt, erros de servidor, links quebradosnoindex, canonical, códigos 4xx/5xx, conteúdo de baixa qualidade
RelaçãoCondição préviaAvaliada após o sucesso do rastreamento

Os dois conceitos são sequenciais. Uma página não rastreada nem chega a ser avaliada para indexação, e apenas as páginas rastreadas com sucesso passam para a fase de indexabilidade.

Fatores que Determinam a Indexabilidade

  1. Diretiva noindex: se a página tiver a meta tag noindex ou o cabeçalho X-Robots-Tag, o mecanismo de busca exclui essa página do índice.
  2. Sinal canonical: se a URL canônica apontar para outra página, essa página é classificada como "página alternativa" e fica de fora da indexação. O Google agrupa páginas semelhantes e indexa apenas uma página representativa por cluster.
  3. Código de status HTTP: apenas páginas que retornam resposta 200 podem ser indexadas. Erros 404/410/5xx, soft 404 e URLs que sofrem redirecionamento ficam de fora do índice.
  4. Relação com o robots.txt: o bloqueio no robots.txt apenas impede o rastreamento, mas não bloqueia diretamente a indexação. Pelo contrário, a página bloqueada fica impossibilitada de ler a tag noindex, podendo surgir o efeito colateral de a URL ser indexada só por links externos.
  5. Qualidade do conteúdo: mesmo uma página tecnicamente indexável pode não ser indexada pelo Google se o conteúdo for raso ou duplicado. É a causa comum do "Rastreada, mas não indexada no momento".

Como Verificar

No relatório de Indexação de páginas (Page Indexing) do Google Search Console, as páginas não indexadas aparecem classificadas por motivo. Conforme o motivo — "Excluída pela tag noindex", "Página alternativa com tag canônica adequada", "Rastreada, mas não indexada no momento" etc. —, dá para julgar se é uma exclusão intencional ou um problema. Para URLs individuais, use a ferramenta de inspeção de URL para verificar o status de indexação e a canônica escolhida pelo Google.

Fontes:

Como o inblog Ajuda

O inblog trata automaticamente o básico para que os posts publicados estejam aptos à indexação. Resposta 200 normal, tag canonical por post e geração automática de sitemap vêm de fábrica, e posts que você queira deixar fora do índice podem ser excluídos com a configuração noindex. Depois de publicar, recomenda-se o hábito de verificar periodicamente a indexação real no relatório de Indexação de páginas do Search Console.