WebMCP
WebMCP (Web Model Context Protocol) ist ein vorgeschlagener W3C-Webstandard, mit dem Websites KI-Agenten, die im Browser arbeiten, die Frage "Was lässt sich auf dieser Website tun?" als strukturierte Tools direkt bereitstellen können, die diese Agenten entdecken und unmittelbar aufrufen. Statt dass Agenten Seiten per Screenshot erfassen und raten, wo zu klicken ist, deklariert die Website ihre Fähigkeiten – die Kontrolle wandert damit zurück zur Website.
WebMCP (Web Model Context Protocol) ist ein vorgeschlagener W3C-Webstandard, mit dem Websites KI-Agenten, die im Browser arbeiten, die Frage "Was lässt sich auf dieser Website tun?" als strukturierte Tools direkt bereitstellen können, die diese Agenten entdecken und unmittelbar aufrufen. Statt dass Agenten Seiten per Screenshot erfassen und raten, wo zu klicken ist, deklariert die Website ihre Fähigkeiten – die Kontrolle wandert damit zurück zur Website.
Warum es wichtig ist
Da KI-Agenten zunehmend Websites im Auftrag von Menschen bedienen, hat sich das Reverse Engineering von für Menschen gedachtem HTML als langsam und fehleranfällig erwiesen. WebMCP wurde von Ingenieuren von Google und Microsoft in der W3C Web Machine Learning Community Group gemeinsam verfasst: Nach einem ersten Explainer im August 2025 folgte am 10. Februar 2026 ein Draft Community Group Report – am selben Tag, an dem Chrome 146 Canary eine flag-basierte Vorschau auslieferte. Stand Juni 2026 ist es zu einem Chrome-Origin-Trial fortgeschritten, das reale Websites testen können. Das im Mai 2026 veröffentlichte Lighthouse 13.3 hat standardmäßig eine Audit-Kategorie "Agentic Browsing" ergänzt, die die WebMCP-Integration prüft. Auch Googles John Mueller äußerte sich dazu: Im Juni 2026 bezeichnete er llms.txt als "vorerst rein spekulativ", während er den WebMCP-Ansatz wegen seiner klaren Ziele und Prozesse befürwortet.
So funktioniert es
Eine Webseite registriert Tools über eine JavaScript-API (registerTool auf modelContext). Jedes Tool besteht aus einem Namen, einer natürlichsprachlichen Beschreibung, einer JSON-Schema-Eingabedefinition und einem Ausführungs-Callback. Eine Website könnte etwa Tools wie "Flüge suchen", "in den Warenkorb legen" oder "Angebot anfordern" deklarieren, und Agenten im Browser entdecken und rufen diese mit demselben Muster der Tool-Nutzung auf, dem LLMs ohnehin folgen. Dutzende "Screenshot → Interpretation → Klick"-Zyklen schrumpfen auf einen einzigen strukturierten Tool-Aufruf, was sowohl Genauigkeit als auch Geschwindigkeit verbessert. Da sich bestehende clientseitige JavaScript-Logik einfach umhüllen lässt, ist keine Neugestaltung der Seite erforderlich, und auch eine deklarative Variante mit annotierten HTML-Formularen wird diskutiert.
Verhältnis zu MCP und llms.txt
- Model Context Protocol: Ein serverseitiger Standard, bei dem ein eigener MCP-Server betrieben wird, um KI-Clients Tools anzubieten. WebMCP überträgt dieselbe Philosophie auf die Webseite selbst (clientseitig) und ermöglicht Agenten, innerhalb der angemeldeten Browser-Sitzung des Nutzers und der bestehenden UI-Logik zu arbeiten.
- llms.txt: Eine statische Textdatei, die Website-Inhalte beschreibt – sie hilft Agenten beim Lesen. WebMCP ist eine aufrufbare Schnittstelle, die Agenten beim Handeln hilft. Beide ergänzen sich, statt zu konkurrieren.
Außer Chrome hat noch kein Browser einen Zeitplan für die Implementierung angekündigt, auch wenn Microsofts Mitautorschaft an der Spezifikation eine Edge-Unterstützung wahrscheinlich macht.
Sources:
- What is WebMCP? - No Hacks
- webmachinelearning/webmcp (W3C Web Machine Learning CG) - GitHub
- Google Confirms LLMs.txt Has No Current Implementation - Search Engine Journal
Wie inblog hilft
Das Registrieren von WebMCP-Tools erfordert Entwicklungsressourcen, doch die Vorstufe – agentenlesbare Inhalte – lässt sich schon heute schaffen. inblog veröffentlicht Beiträge mit semantischem HTML und automatisch angewandten strukturierten Daten (JSON-LD), sodass Blog-Inhalte für Agenten leicht zu parsen sind. Wer Produktdokumentation, FAQs und Leitfäden mit inblog aufbereitet, legt das inhaltliche Fundament, mit dem die Tools der Website zusammenwirken, sobald sich agentisches Browsing durchsetzt.