SEO

X-Robots-Tag

O X-Robots-Tag e uma forma de controlar o rastreamento e a indexacao dos mecanismos de busca por meio de cabecalhos de resposta HTTP. Em vez de colocar <meta name="robots"> dentro do HTML, o servidor envia as mesmas diretivas em um cabecalho de resposta como X-Robots-Tag: noindex.

O X-Robots-Tag e uma forma de controlar o rastreamento e a indexacao dos mecanismos de busca por meio de cabecalhos de resposta HTTP. Em vez de colocar <meta name="robots"> dentro do HTML, o servidor envia as mesmas diretivas em um cabecalho de resposta como X-Robots-Tag: noindex.

Por Que Importa

As meta tags HTML so funcionam dentro de arquivos HTML. Recursos que nao sao HTML (PDFs, imagens, videos, respostas de API em JSON) nao podem usar tags <meta>, deixando uma lacuna no controle de indexacao. O X-Robots-Tag preenche essa lacuna ao se aplicar a qualquer resposta HTTP. O Search Engine Land documentou casos de e-commerce em que dezenas de milhares de catalogos em PDF foram indexados e prejudicaram o ranqueamento como conteudo duplicado, resolvido de uma so vez com o X-Robots-Tag.

X-Robots-Tag vs Meta Robots vs robots.txt

MetodoLocalEscopoBloqueia o rastreamento?
robots.txt/robots.txtPadroes de URLSim, bloqueia o proprio rastreamento
Meta Robots<head> do HTMLAquela pagina HTMLNao, controla apenas a indexacao
X-Robots-TagCabecalho de resposta HTTPQualquer tipo de recursoNao, controla apenas a indexacao

Distincao critica: o robots.txt diz "nao rastreie", enquanto o Meta Robots e o X-Robots-Tag dizem "nao indexe". Para bloquear a indexacao, o Googlebot precisa de fato alcancar a pagina para ler a diretiva. Bloquear no robots.txt interrompe o rastreamento por completo, de modo que o Google nunca ve a instrucao de indexacao.

Principais Diretivas

DiretivaSignificado
noindexNao mostrar nos resultados de busca
nofollowNao seguir os links da pagina
noneO mesmo que noindex, nofollow
noarchiveNao mostrar uma copia em cache nas SERPs
nosnippetNao mostrar snippets nem miniaturas
unavailable_after: [date]Remover do indice apos a data
max-snippet: [n]Limitar o tamanho do snippet
max-image-preview: [setting]Limitar o tamanho da previa de imagem
max-video-preview: [n]Limitar a duracao da previa de video

Para controle no nivel de snippet dentro de uma pagina HTML, use data-nosnippet no elemento exato que voce quer excluir dos snippets de busca. Isso e diferente do X-Robots-Tag porque oculta apenas o texto selecionado, em vez de alterar o estado de indexacao do recurso inteiro.

Exemplos de Configuracao

Bloquear a indexacao de PDF (Apache .htaccess):

<FilesMatch "\.pdf$">
  Header set X-Robots-Tag "noindex, nofollow"
</FilesMatch>

Bloquear um diretorio de imagens (Nginx):

location /private-images/ {
  add_header X-Robots-Tag "noindex";
}

Direcionar a um rastreador especifico (apenas Googlebot):

X-Robots-Tag: googlebot: noindex

Indexacao por tempo limitado:

X-Robots-Tag: unavailable_after: 31 Dec 2026 23:59:59 GMT

Exclusao de snippet no nivel do elemento (HTML):

<p data-nosnippet>Do not show this sentence in Google snippets.</p>

Detalhes Praticos a Observar

Nao combine com o disallow do robots.txt: Se o robots.txt bloquear a URL, o Google nao consegue ler o cabecalho de jeito nenhum. Para bloquear a indexacao, permita o rastreamento no robots.txt e use o noindex do X-Robots-Tag.

Requer configuracao no servidor: Ao contrario das meta tags, o X-Robots-Tag e configurado no nivel do servidor web (Apache, Nginx, Cloudflare Workers). As plataformas de CMS nem sempre lidam com ele automaticamente.

Verifique com o Search Console ou o curl: Confira se o cabecalho realmente aparece com a ferramenta de Inspecao de URL do Google Search Console ou com curl -I https://example.com/file.pdf.

Controles de snippet nao sao controles de privacidade: nosnippet e data-nosnippet mudam como o Google exibe um resultado, mas o conteudo subjacente continua publicamente acessivel. Use autenticacao ou controle de acesso no lado do servidor para conteudo privado.

Fontes: