Was ist KI-Halluzination? | GEO-Glossar

Halluzination liegt vor, wenn ein großes Sprachmodell Inhalte erzeugt, die unwahr oder nicht belegt sind, sie aber mit hoher Selbstsicherheit präsentiert, indem es Zitate erfindet, Statistiken fabriziert oder Fakten behauptet, die nicht existieren. Es ist die größte einzelne Bedrohung für die Glaubwürdigkeit KI-generierter Suchantworten.

Warum es wichtig ist

Das Stanford-/Vectara-Hallucination-Leaderboard von 2024 zeigt, dass selbst Spitzenmodelle bei Zusammenfassungsaufgaben noch in 2 bis 15 % der Fälle halluzinieren. Im Jahr 2026, in dem sich Nutzer stark auf die KI-Suche verlassen, kann ein einziges halluziniertes Zitat das Markenvertrauen ernsthaft schädigen. Für GEO besteht die Herausforderung nicht nur darin, zitiert zu werden, sondern korrekt zitiert zu werden.

Warum Halluzinationen auftreten

Probabilistische Erzeugung: LLMs sagen den wahrscheinlichsten nächsten Token voraus, nicht die Wahrheit. Die "wahrscheinlichste Fortsetzung der Trainingsverteilung" ist nicht dasselbe wie "ein Fakt", sodass Modelle plausible Antworten erfinden, wenn sie es eigentlich nicht wissen.

Grenzen der Trainingsdaten: Aktuelle Ereignisse, Nischenbereiche und nicht-englische Inhalte sind nur spärlich vertreten und hinterlassen Lücken.

Mehrdeutige Prompts: Vage Fragen verleiten das Modell dazu, die Lücken durch Raten zu füllen.

Schwacher RAG-Kontext: Wenn der Abruf keine relevanten Passagen liefert, greift das Modell auf sein eigenes "Gedächtnis" zurück, die Bedingung mit dem höchsten Halluzinationsrisiko.

Arten von Halluzination

Intrinsisch: Widerspricht der Quelle direkt. Das Dokument sagt "10 Mio. USD Umsatz", das Modell sagt "100 Mio. USD".

Extrinsisch: Fügt Fakten hinzu, die nicht in der Quelle stehen. Das Modell erfindet Informationen ohne jede Zuschreibung.

Faktisch: Objektiv falsch, unabhängig von der Quelle, erfundene Personen, Daten oder Zahlen.

GEO-Abwehrmaßnahmen

Eindeutige, unmissverständliche Fakten: Aussagesätze lassen dem Modell keinen Raum für Fehlinterpretationen. "inblog wurde 2020 gegründet" ist besser als eine vage Formulierung.

Zahlen mit Quellen versehen: Jede Statistik sollte ihre Quelle und das Jahr tragen, damit RAG-Pipelines die Zitierung erfassen können.

Vage Mengenangaben vermeiden: "Viele", "die meisten", "erheblich", das Modell wird eine erfundene Zahl einsetzen. Verwenden Sie konkrete Werte.

Konsistente Markenbenennung: Vereinheitlichen Sie Produkt- und Firmennamen. Das Vermischen von "inblog", "Inblog" und "In Blog" führt dazu, dass Modelle sie als getrennte oder verwechselte Entitäten behandeln.

Strukturierte FAQs: Frage-Antwort-Blöcke erhöhen die Zitiergenauigkeit drastisch.

Schema.org-Markup: Strukturierte Daten vom Typ Organization, Article und FAQPage helfen LLMs, Entitäten eindeutig zu identifizieren.

Quellen: