GEO

Kontextfenster

Ein Kontextfenster ist die maximale Anzahl an Eingabe- und Ausgabe-Tokens, die ein LLM in einer einzigen Anfrage verarbeiten kann. Es enthält den Nutzer-Prompt, den System-Prompt, das vorherige Gespräch, per RAG abgerufene Dokumente und die erzeugte Antwort, alles auf einmal.

Ein Kontextfenster ist die maximale Anzahl an Eingabe- und Ausgabe-Tokens, die ein LLM in einer einzigen Anfrage verarbeiten kann. Es enthält den Nutzer-Prompt, den System-Prompt, das vorherige Gespräch, per RAG abgerufene Dokumente und die erzeugte Antwort, alles auf einmal.

Warum es wichtig ist

Das Kontextfenster ist das "Kurzzeitgedächtnis" des LLM. Es bestimmt, wie viele Webseiten eine AI-Suche-Engine bei der Beantwortung einer Anfrage berücksichtigen kann und wie lang ein Dokument sein darf, das sie zusammenfasst. 2023 lag die Norm bei 4K bis 8K Token; 2026 sind 1M+ Token Standard, was die Breite und Tiefe der Quellen, aus denen LLMs schöpfen, grundlegend verändert. Für GEO bedeutet das: Die AI-Suche vergleicht nun viele konkurrierende Seiten auf einmal und entscheidet, welche sie zitiert, wodurch Dokumentstruktur und Abschnittsqualität zum ausschlaggebenden Faktor werden.

Kontextfenster nach Modell (2026)

ModellKontextfenster
Claude Opus 4.61M Token
Gemini 31M–2M Token
GPT-5400K Token
Llama 4128K–1M Token

1M Token entsprechen ungefähr 750K englischen Wörtern, also etwa einem Buch mit 400 bis 500 Seiten.

Tokens, nicht Wörter

Kontextfenster werden in Tokens gemessen, nicht in Wörtern. Englisch hat im Schnitt etwa 1,3 Token pro Wort, aber Sprachen wie Koreanisch oder Japanisch verbrauchen etwa 1,5 bis 2 Token pro Zeichen, was bedeutet, dass nicht-englische Inhalte bei gleicher Seitenlänge deutlich mehr vom Budget beanspruchen.

GEO-Auswirkungen

Ganze Dokumente werden verarbeitet: LLMs sahen früher nur die obersten Ausschnitte; nun lesen sie ganze Seiten und wählen den besten Abschnitt zum Zitieren. Strukturelle Klarheit über das gesamte Dokument zählt.

Direkter Wettbewerbsvergleich: Große Kontextfenster lassen Modelle viele konkurrierende Seiten für dieselbe Anfrage auf einmal vergleichen. Zu gewinnen heißt nicht, "gut" zu sein, sondern strukturell leichter zitierbar zu sein als die Alternativen.

Front-Loading zählt mehr: LLMs gewichten frühere Tokens stärker. Setzen Sie die Kerndefinition und die Antwort ganz an den Anfang des Dokuments.

"Lost in the Middle": Selbst Modelle mit großem Kontext verschlechtern sich bei Informationen, die mitten im Dokument vergraben sind. Kritische Inhalte gehören an den Anfang oder das Ende, nicht in die Mitte.

Sources: