GEO

Content Signals

Content Signals es un estándar de políticas que amplía robots.txt para que un sitio web pueda declarar, en formato legible por máquina, cómo prefiere que se use su contenido tras el rastreo: para búsqueda, para respuestas de IA en tiempo real (ai-input) o para el entrenamiento de IA (ai-train). Cloudflare lo anunció el 24 de septiembre de 2025.

Content Signals es un estándar de políticas que amplía robots.txt para que un sitio web pueda declarar, en formato legible por máquina, cómo prefiere que se use su contenido tras el rastreo: para búsqueda, para respuestas de IA en tiempo real (ai-input) o para el entrenamiento de IA (ai-train). Cloudflare lo anunció el 24 de septiembre de 2025.

Por qué es importante

El robots.txt clásico solo expresa quién puede acceder a qué rutas; no dice nada sobre qué ocurre con el contenido después de obtenerlo. El problema es que un mismo rastreador suele servir a varios propósitos. Google, por ejemplo, usa el mismo rastreador para la indexación de búsqueda y para las funciones de IA, así que bloquear de plano un rastreador de IA no dejaba forma de seguir siendo visible en la búsqueda y, a la vez, rechazar el entrenamiento de IA. Content Signals cubre ese vacío al permitir que los sitios declaren preferencias por caso de uso en lugar de por bot. Se ha convertido en uno de los pilares del debate más amplio sobre cómo los propietarios de contenido recuperan el control en la era de la IA.

Las tres señales y la sintaxis

  • search: Construir un índice de búsqueda y servir resultados de búsqueda. No incluye los resúmenes generados por IA.
  • ai-input: Alimentar modelos de IA con el contenido para generar respuestas en tiempo real (grounding, RAG y usos similares).
  • ai-train: Entrenar o ajustar (fine-tuning) modelos de IA.

Las preferencias se escriben dentro de robots.txt como valores yes/no separados por comas:

Content-Signal: search=yes, ai-input=yes, ai-train=no
User-Agent: *
Allow: /

Omitir una señal significa que no se expresa ninguna preferencia para ese uso. Cloudflare aplicó search=yes, ai-train=no como valor por defecto para los más de 3,8 millones de dominios que usan su robots.txt gestionado, dejando deliberadamente ai-input sin definir para que decida cada propietario del sitio.

Limitaciones y el ángulo GEO

Content Signals es una declaración de preferencia, no una contramedida técnica: los rastreadores que la ignoran no se detienen. Aun así, una declaración explícita y legible por máquina puede tener peso en futuras disputas sobre el uso del contenido, y Cloudflare lo diseñó para combinarlo con herramientas de aplicación como el bloqueo de bots y Pay Per Crawl. Para el GEO, la tensión clave es que ai-input es un arma de doble filo: si tu objetivo es que te citen en las respuestas de IA, poner ai-input en "no" elimina por completo la posibilidad de ser citado a través del rastreo con IA. Por eso los sitios que buscan visibilidad de marca suelen mantener search=yes, ai-input=yes y rechazar de forma selectiva solo ai-train.

Sources:

Cómo ayuda inblog

La mayoría de los blogs publicados con inblog existen para ser visibles tanto en la búsqueda como en las respuestas de IA, así que, si adoptas Content Signals, mantener search y ai-input abiertos es la configuración natural. La analítica integrada de inblog muestra el tráfico de referencia desde los canales de IA, lo que te permite verificar con datos que permitir ai-input se traduce realmente en visitas, mientras que la integración con Google Search Console mantiene la visibilidad de búsqueda en la misma vista.