GEO

NLWeb

NLWeb (Natural Language Web) ist ein offenes Protokoll und Open-Source-Projekt, das Microsoft im Mai 2025 auf der Build vorstellte. Es verleiht jeder Website eine natürlichsprachige Schnittstelle, und jede NLWeb-Instanz fungiert zugleich als Model-Context-Protocol-Server (MCP). Das Projekt wird bei Microsoft von R.V. Guha geleitet – dem Schöpfer von RSS, RDF und Schema.org – und wird oft so zusammengefasst: "NLWeb verhält sich zu MCP wie HTML zu HTTP."

NLWeb (Natural Language Web) ist ein offenes Protokoll und Open-Source-Projekt, das Microsoft im Mai 2025 auf der Build vorstellte. Es verleiht jeder Website eine natürlichsprachige Schnittstelle, und jede NLWeb-Instanz fungiert zugleich als Model-Context-Protocol-Server (MCP). Das Projekt wird bei Microsoft von R.V. Guha geleitet – dem Schöpfer von RSS, RDF und Schema.org – und wird oft so zusammengefasst: "NLWeb verhält sich zu MCP wie HTML zu HTTP."

Warum es wichtig ist

Bislang war der Hauptweg einer Website in KI-Systeme passiv: Crawler sammelten Seiten und trugen sie anderswohin. NLWeb kehrt das um und macht die Website selbst zu einem aktiven Endpunkt, der Fragen entgegennimmt und beantwortet. Besucher durchsuchen die Inhalte der Website in natürlicher Sprache, während KI-Agenten dieselbe Schnittstelle über MCP aufrufen, um Website-Daten direkt abzufragen. Dass Menschen und Agenten eine einzige natürlichsprachige API teilen, ist der Kerngedanke – und so bleiben einzelne Websites erstklassige Teilnehmer im agentischen Web.

Wie es funktioniert

NLWeb nährt sich aus den halbstrukturierten Daten, die Websites ohnehin veröffentlichen.

  • Datenschicht: Vorhandenes Schema.org-Markup, RSS-Feeds und ähnliche strukturierte Daten werden gesammelt und in einem Vektorspeicher indexiert.
  • Die ask-Methode: Die zentrale API nimmt eine natürlichsprachige Frage entgegen, verarbeitet sie mit einem LLM und gibt die Antwort als Schema.org-formatiertes JSON zurück.
  • MCP-Server: Da jede NLWeb-Instanz zugleich ein MCP-Server ist, können MCP-kompatible KI-Clients und Agenten die Website ohne jede individuelle Integration abfragen.

Verbreitung

Zu den Launch-Partnern gehörten Tripadvisor, Shopify, Snowflake, O'Reilly Media und Eventbrite. Im August 2025 kombinierte Cloudflare NLWeb mit seiner AutoRAG-Infrastruktur: Man wählt eine Domain, und Crawling, Indexierung und Bereitstellung erfolgen automatisch. Dieser verwaltete Weg bedeutet, dass eine Website mit wenigen Klicks dialogfähig werden kann, ohne einen eigenen Server zu betreiben. Die Build 2026 war die erste Bühne, auf der das Protokoll an dokumentierten Implementierungen statt an seinem Potenzial gemessen wurde.

Bedeutung für GEO

NLWeb vervielfacht den Ertrag strukturierter Daten. Schema.org-Markup ist nicht länger nur Zusatzinformation für Suchmaschinen, sondern wird zum Rohstoff für eine dialogorientierte Schnittstelle und eine Agenten-API. Und während llms.txt eine Broschüre ist, die der KI mitteilt, welche Inhalte existieren, ist NLWeb die Ausführungsschicht, die Fragen direkt beantwortet. Über das Zitiertwerden durch externe KI-Suche hinaus erhält eine Website damit einen eigenen Kanal, um aus ihren eigenen Inhalten zu antworten.

Sources:

Wie inblog hilft

Protokolle wie NLWeb hängen letztlich von der Qualität der strukturierten Daten ab, die eine Website veröffentlicht. inblog-Blogs liefern von Haus aus sauberes Markup und eine saubere Metadatenstruktur, sodass eine dialogorientierte Schicht wie NLWeb die Inhalte unverändert indexieren kann. Halten Sie Überschriften klar und den Fließtext gut strukturiert, dann erfordert die Verwandlung Ihrer Website in einen abfragbaren Knoten des agentischen Webs nur minimalen Zusatzaufwand.