NLWeb
NLWeb (Natural Language Web) est un protocole ouvert et un projet open source annoncé par Microsoft à la conférence Build en mai 2025. Il dote n'importe quel site web d'une interface en langage naturel, et chaque instance NLWeb fait également office de serveur Model Context Protocol (MCP). Le projet est dirigé chez Microsoft par R.V. Guha — créateur de RSS, RDF et Schema.org — et se résume souvent par la formule : « NLWeb est à MCP ce que le HTML est au HTTP ».
NLWeb (Natural Language Web) est un protocole ouvert et un projet open source annoncé par Microsoft à la conférence Build en mai 2025. Il dote n'importe quel site web d'une interface en langage naturel, et chaque instance NLWeb fait également office de serveur Model Context Protocol (MCP). Le projet est dirigé chez Microsoft par R.V. Guha — créateur de RSS, RDF et Schema.org — et se résume souvent par la formule : « NLWeb est à MCP ce que le HTML est au HTTP ».
Pourquoi c'est important
Jusqu'à présent, la principale voie d'accès d'un site web aux systèmes d'IA était passive : les crawlers collectaient les pages et les emportaient ailleurs. NLWeb renverse cette logique en transformant le site lui-même en un point de terminaison actif qui reçoit des questions et y répond. Les visiteurs interrogent le contenu du site en langage naturel, tandis que les agents IA appellent la même interface via MCP pour interroger directement les données du site. Le partage d'une seule API en langage naturel entre humains et agents constitue l'idée centrale — et c'est ainsi que les sites individuels restent des participants de premier plan du web agentique.
Comment ça fonctionne
NLWeb se nourrit des données semi-structurées que les sites publient déjà.
- Couche de données : le balisage Schema.org existant, les flux RSS et d'autres données structurées similaires sont collectés et indexés dans un magasin vectoriel.
- La méthode ask : l'API centrale reçoit une question en langage naturel, la traite avec un LLM et renvoie la réponse au format JSON conforme à Schema.org.
- Serveur MCP : puisque chaque instance NLWeb est aussi un serveur MCP, les clients et agents IA compatibles MCP peuvent interroger le site sans aucune intégration sur mesure.
Adoption
Parmi les partenaires de lancement figuraient Tripadvisor, Shopify, Snowflake, O'Reilly Media et Eventbrite. En août 2025, Cloudflare a combiné NLWeb avec son infrastructure AutoRAG : il suffit de choisir un domaine pour que le crawling, l'indexation et le déploiement s'effectuent automatiquement. Cette voie managée permet à un site de devenir conversationnel en quelques clics, sans avoir à gérer son propre serveur. Build 2026 a été la première occasion où le protocole a été évalué sur des déploiements documentés plutôt que sur son potentiel.
Implications pour le GEO
NLWeb décuple le rendement des données structurées. Le balisage Schema.org cesse d'être une simple information complémentaire destinée aux moteurs de recherche pour devenir la matière première d'une interface conversationnelle et d'une API d'agents. Et là où llms.txt est une brochure indiquant à l'IA quel contenu existe, NLWeb est la couche d'exécution qui répond directement aux questions. Au-delà d'être cité par une recherche IA externe, un site se dote de son propre canal pour répondre à partir de son contenu.
Sources :
- Introducing NLWeb: Bringing conversational interfaces directly to the web - Microsoft
- NLWeb Reference Implementation - GitHub
- Make Your Website Conversational with NLWeb and AutoRAG - Cloudflare
Comment inblog vous aide
Les protocoles comme NLWeb dépendent en définitive de la qualité des données structurées qu'un site publie. Les blogs inblog s'accompagnent par défaut d'un balisage propre et d'une structure de métadonnées soignée, de sorte qu'une couche conversationnelle comme NLWeb peut indexer le contenu tel quel. En gardant des titres clairs et un corps de texte bien structuré, transformer votre site en un nœud interrogeable du web agentique ne demande qu'un effort minimal.