GEO

Content Signals

Content Signals ist ein Richtlinienstandard, der robots.txt erweitert, sodass eine Website in maschinenlesbarer Form erklären kann, wie sie die Nutzung ihrer Inhalte nach dem Crawling bevorzugt: für die Suche, für KI-Antworten in Echtzeit (ai-input) oder für das KI-Training (ai-train). Cloudflare kündigte ihn am 24. September 2025 an.

Content Signals ist ein Richtlinienstandard, der robots.txt erweitert, sodass eine Website in maschinenlesbarer Form erklären kann, wie sie die Nutzung ihrer Inhalte nach dem Crawling bevorzugt: für die Suche, für KI-Antworten in Echtzeit (ai-input) oder für das KI-Training (ai-train). Cloudflare kündigte ihn am 24. September 2025 an.

Warum es wichtig ist

Klassisches robots.txt drückt nur aus, wer auf welche Pfade zugreifen darf – über das, was nach dem Abruf mit den Inhalten geschieht, sagt es nichts aus. Das Problem ist, dass ein einzelner Crawler oft mehreren Zwecken dient. Google etwa nutzt denselben Crawler für die Suchindexierung und für KI-Funktionen, sodass das vollständige Blockieren eines AI-Crawlers keine Möglichkeit ließ, in der Suche sichtbar zu bleiben und zugleich das KI-Training abzulehnen. Content Signals schließt diese Lücke, indem es Websites erlaubt, Präferenzen pro Nutzungszweck statt pro Bot zu deklarieren. Es ist zu einer Säule der breiteren Debatte darüber geworden, wie Content-Eigentümer im Zeitalter der KI die Kontrolle zurückgewinnen.

Die drei Signale und die Syntax

  • search: Aufbau eines Suchindex und Bereitstellung von Suchergebnissen. Schließt KI-generierte Zusammenfassungen nicht ein.
  • ai-input: Einspeisung von Inhalten in KI-Modelle zur Erzeugung von Echtzeit-Antworten (Grounding, RAG und ähnliche Nutzungen).
  • ai-train: Training oder Feintuning von KI-Modellen.

Präferenzen werden innerhalb von robots.txt als kommagetrennte yes/no-Werte angegeben:

Content-Signal: search=yes, ai-input=yes, ai-train=no
User-Agent: *
Allow: /

Wird ein Signal weggelassen, bedeutet das, dass für diese Nutzung keine Präferenz ausgedrückt wird. Cloudflare wandte search=yes, ai-train=no als Standard für die über 3,8 Millionen Domains an, die seine verwaltete robots.txt nutzen, und ließ ai-input bewusst unbestimmt, damit jeder Website-Betreiber selbst entscheidet.

Grenzen und der GEO-Blickwinkel

Content Signals sind eine Präferenzerklärung, keine technische Gegenmaßnahme – Crawler, die sie ignorieren, werden nicht gestoppt. Dennoch kann eine ausdrückliche maschinenlesbare Erklärung bei künftigen Streitigkeiten über die Content-Nutzung Gewicht haben, und Cloudflare hat sie so konzipiert, dass sie mit Durchsetzungswerkzeugen wie Bot-Blocking und Pay Per Crawl kombiniert wird. Für GEO besteht die zentrale Spannung darin, dass ai-input zweischneidig ist: Wenn Ihr Ziel darin besteht, in KI-Antworten zitiert zu werden, beseitigt das Setzen von ai-input auf "no" die Chance, überhaupt über das AI-Crawling zitiert zu werden. Deshalb behalten Websites, die auf Markensichtbarkeit abzielen, typischerweise search=yes, ai-input=yes bei und lehnen selektiv nur ai-train ab.

Sources:

Wie inblog hilft

Die meisten mit inblog veröffentlichten Blogs sind darauf ausgerichtet, sowohl in der Suche als auch in KI-Antworten sichtbar zu sein. Wenn Sie also Content Signals einsetzen, ist es die natürliche Konfiguration, search und ai-input offen zu halten. Mit der integrierten Analytics-Funktion von inblog können Sie anhand von Daten überprüfen, ob das Zulassen von ai-input tatsächlich zu Besuchen führt, während die Google-Search-Console-Anbindung die Suchsichtbarkeit in derselben Ansicht hält.