Noindex
Noindex e uma diretiva da meta robots que instrui os mecanismos de busca a nao incluir uma pagina especifica nos resultados de busca. Pode ser definida por meio de uma tag HTML <meta> ou de um cabecalho de resposta HTTP (X-Robots-Tag), impedindo que a pagina apareca nas paginas de resultados dos mecanismos de busca (SERPs), como Google e Bing.
Noindex e uma diretiva da meta robots que instrui os mecanismos de busca a nao incluir uma pagina especifica nos resultados de busca. Pode ser definida por meio de uma tag HTML <meta> ou de um cabecalho de resposta HTTP (X-Robots-Tag), impedindo que a pagina apareca nas paginas de resultados dos mecanismos de busca (SERPs), como Google e Bing.
Por Que Importa
Os mecanismos de busca tentam rastrear e indexar todas as paginas de um site. No entanto, nem todas as paginas merecem aparecer nos resultados de busca. Se paginas como paginas de login, paginas de resultados de busca interna, paginas de agradecimento ou paginas de ambiente de staging forem indexadas, o orcamento de rastreamento e desperdicado, surgem problemas de conteudo duplicado e a avaliacao geral da qualidade de busca do site pode ser prejudicada. Usar o noindex corretamente permite direcionar os mecanismos de busca a concentrar os recursos de rastreamento nas paginas que realmente oferecem valor.
Como Configurar
- Metodo da Meta Tag HTML
Adicione a seguinte tag a secao <head> da pagina:
<meta name="robots" content="noindex">
Voce tambem pode mirar mecanismos de busca especificos. Por exemplo, para aplicar noindex apenas ao Google, altere o atributo name para googlebot:
<meta name="googlebot" content="noindex">
Para tambem bloquear o rastreamento de links, use nofollow em conjunto:
<meta name="robots" content="noindex, nofollow">
- Metodo do Cabecalho HTTP (X-Robots-Tag)
Para recursos que nao sao HTML (PDFs, imagens, etc.) nos quais nao e possivel inserir meta tags, defina a diretiva no cabecalho de resposta do servidor:
X-Robots-Tag: noindex
Em frameworks como o Next.js, voce pode definir os cabecalhos de resposta diretamente em API routes ou no getServerSideProps.
Quando Usar
Aplicar noindex e recomendado para os seguintes tipos de pagina:
- Paginas de resultados de busca interna: Paginas dinamicas geradas pela funcionalidade de busca do proprio site podem ser percebidas como conteudo duplicado pelos mecanismos de busca.
- Paginas de login, cadastro e perfil: Paginas com informacoes pessoais que nao precisam ser expostas nos resultados de busca.
- Paginas de agradecimento: Paginas de confirmacao exibidas apos o envio de um formulario nao tem valor de trafego de busca.
- Ambientes de staging e de teste: Evita que sites de desenvolvimento sejam indexados por acidente. Porem, garanta que o noindex seja removido ao publicar em producao.
- Paginas com conteudo duplicado: Se a relacao entre uma pagina canonica e uma duplicata for clara, no entanto, uma tag
canonicalpode ser uma solucao mais adequada. - Paginas exclusivas de administracao: Dashboards, paineis de administracao e paginas semelhantes nao precisam de exposicao na busca.
Diferencas entre Noindex e Disallow
Noindex e a diretiva Disallow no robots.txt sao frequentemente confundidos, mas o comportamento deles e fundamentalmente diferente.
| Atributo | noindex (meta tag) | Disallow (robots.txt) |
|---|---|---|
| Funcao | Exclui a pagina dos resultados de busca | Bloqueia totalmente o acesso do rastreador a pagina |
| Indexacao | Permite o rastreamento mas bloqueia a indexacao | Bloqueia o rastreamento, mas a pagina ainda pode ser indexada por links externos |
| Link equity | O valor de link (link equity) da pagina ainda pode ser transmitido | Os rastreadores nao conseguem ler a pagina, entao o valor de link nao pode ser transferido |
| Escopo | Controle preciso no nivel de pagina individual | Controle em lote no nivel de diretorio ou de padrao de URL |
A ressalva mais critica e que voce nao deve usar os dois simultaneamente. Se o rastreamento for bloqueado pelo robots.txt, o mecanismo de busca nao consegue ler a tag noindex na pagina, fazendo com que a diretiva noindex seja ignorada - e a pagina pode permanecer nos resultados de busca. Para excluir uma pagina dos resultados de busca de forma confiavel, permita o rastreamento e use a meta tag noindex.
Fontes:
- Block Search Indexing with noindex - Google Search Central
- What Is Noindex Used for? An Overview + Best Practices - Semrush
- What is a Noindex Tag? - Ahrefs
Posts Relacionados do inblog
Como o inblog Ajuda
O inblog permite definir noindex em posts individuais ou em paginas de tag para evitar que paginas indesejadas sejam indexadas.