Content Signals
Content Signals é um padrão de política que estende o robots.txt para que um site declare, em formato legível por máquina, como prefere que seu conteúdo seja usado depois do rastreamento: para busca, para respostas de IA em tempo real (ai-input) ou para treinamento de IA (ai-train). A Cloudflare o anunciou em 24 de setembro de 2025.
Content Signals é um padrão de política que estende o robots.txt para que um site declare, em formato legível por máquina, como prefere que seu conteúdo seja usado depois do rastreamento: para busca, para respostas de IA em tempo real (ai-input) ou para treinamento de IA (ai-train). A Cloudflare o anunciou em 24 de setembro de 2025.
Por Que Importa
O robots.txt clássico só expressa quem pode acessar quais caminhos — ele nada diz sobre o que acontece com o conteúdo depois de ser coletado. O problema é que um único rastreador costuma servir a múltiplos propósitos. O Google, por exemplo, usa o mesmo rastreador para indexação de busca e para recursos de IA, então bloquear um rastreador de IA por completo não deixava nenhuma forma de permanecer visível na busca e, ao mesmo tempo, recusar o treinamento de IA. O Content Signals preenche essa lacuna ao permitir que os sites declarem preferências por caso de uso, e não por bot. Ele se tornou um dos pilares do debate mais amplo sobre como os donos de conteúdo retomam o controle na era da IA.
Os Três Sinais e a Sintaxe
- search: Construir um índice de busca e exibir resultados de busca. Não inclui resumos gerados por IA.
- ai-input: Alimentar modelos de IA com o conteúdo para gerar respostas em tempo real (grounding, RAG e usos semelhantes).
- ai-train: Treinar ou fazer fine-tuning de modelos de IA.
As preferências são escritas dentro do robots.txt como valores yes/no separados por vírgula:
Content-Signal: search=yes, ai-input=yes, ai-train=no
User-Agent: *
Allow: /
Omitir um sinal significa que nenhuma preferência foi expressa para aquele uso. A Cloudflare aplicou search=yes, ai-train=no como padrão para os mais de 3,8 milhões de domínios que usam seu robots.txt gerenciado, deixando o ai-input deliberadamente sem definição para que cada dono do site decida.
Limitações e o Ângulo do GEO
O Content Signals é uma declaração de preferência, não uma contramedida técnica — rastreadores que o ignoram não são bloqueados. Ainda assim, uma declaração explícita e legível por máquina pode ter peso em futuras disputas sobre o uso de conteúdo, e a Cloudflare o projetou para ser combinado com ferramentas de imposição, como o bloqueio de bots e o Pay Per Crawl. Para o GEO, a tensão central é que o ai-input corta dos dois lados: se o seu objetivo é ser citado em respostas de IA, definir o ai-input como "no" elimina por completo a chance de ser citado via rastreamento de IA. É por isso que sites que buscam visibilidade de marca normalmente mantêm search=yes, ai-input=yes e recusam seletivamente apenas o ai-train.
Fontes:
Como o inblog Ajuda
A maioria dos blogs publicados com o inblog existe para ser visível tanto na busca quanto nas respostas de IA, então, se você adotar o Content Signals, manter search e ai-input abertos é a configuração natural. A analítica integrada do inblog mostra o tráfego de referência vindo de canais de IA, permitindo verificar com dados se permitir o ai-input realmente se traduz em visitas, enquanto a integração com o Google Search Console mantém a visibilidade de busca na mesma tela.