llms.txt
llms.txt est un fichier markdown proposé, servi à la racine d'un site web, à l'adresse /llms.txt, qui fournit aux outils basés sur les LLM une carte condensée et organisée des contenus les plus importants d'un site. Proposé par Jeremy Howard en 2024, il vise à faire pour l'IA ce que sitemap.xml a fait pour la recherche : rendre les meilleures parties de votre site repérables et assimilables à la vitesse de la machine.
llms.txt est un fichier markdown proposé, servi à la racine d'un site web, à l'adresse /llms.txt, qui fournit aux outils basés sur les LLM une carte condensée et organisée des contenus les plus importants d'un site. Proposé par Jeremy Howard en 2024, il vise à faire pour l'IA ce que sitemap.xml a fait pour la recherche : rendre les meilleures parties de votre site repérables et assimilables à la vitesse de la machine.
Pourquoi c'est important
Les LLM qui lisent le web se heurtent à un problème de fenêtre de contexte : un seul site marketing peut dépasser 200 K tokens de HTML, de CSS et de code de navigation avant que le modèle n'atteigne le contenu réel. llms.txt résout cela en fournissant une liste courte et organisée des pages que le propriétaire du site souhaite voir lues par un LLM, rédigée dans un markdown propre, sans superflu. Anthropic, Cloudflare, Mintlify, Zapier et Stripe ont tous publié des fichiers llms.txt en 2024. Pour les marques qui veulent être comprises et correctement citées par l'IA, cela devient l'action GEO la plus déterminante et la moins coûteuse.
À quoi cela ressemble
Un fichier de base :
# inblog
> inblog is an AI-powered blogging platform for SEO-optimized content.
## Docs
- [Getting started](https://inblog.ai/docs/getting-started): Create your first blog
- [SEO features](https://inblog.ai/docs/seo): Built-in SEO optimization
- [AI drafting](https://inblog.ai/docs/ai-drafts): How AI drafts work
## Optional
- [Changelog](https://inblog.ai/changelog): Product updates
Deux sections : un titre et un résumé, puis des liens organisés et regroupés par finalité. La section Optional répertorie le contenu qu'un LLM ne devrait lire qu'en cas de besoin d'approfondissement.
llms.txt vs robots.txt vs sitemap.xml
| Fichier | Public | Finalité |
|---|---|---|
robots.txt | Robots d'exploration | Ce qu'il ne faut pas explorer |
sitemap.xml | Moteurs de recherche | Liste complète des pages à indexer |
llms.txt | Outils basés sur les LLM | Contenu organisé et priorisé pour l'ingestion |
robots.txt est une clôture. sitemap.xml est un annuaire. llms.txt est l'étagère de recommandations d'un libraire. Ils sont complémentaires, et non interchangeables.
Deux variantes
llms.txt : la carte courte et organisée, la table des matières.
llms-full.txt : une version étendue où le contenu markdown de chaque page liée est intégré en ligne, offrant à un LLM l'intégralité du corpus assimilable en un seul fichier. Utilisée par des sites de documentation comme ceux d'Anthropic et des clients de Mintlify.
Comment rédiger un bon llms.txt
1. Commencez par une phrase de positionnement : la citation en bloc après le H1. C'est ce que le LLM apprend de l'identité de votre marque.
2. Regroupez par finalité, pas par structure : « Docs », « Guides », « API Reference », « Études de cas », et non « Catégorie A », « Catégorie B ».
3. Rédigez les descriptions de liens comme des faits, pas comme du marketing : « Optimisation SEO intégrée » vaut mieux que « Boostez votre contenu ».
4. Placez les pages les plus importantes en premier : sous la pression du contexte, les LLM lisent de haut en bas.
5. Utilisez Optional pour le contenu de niche : ce que le LLM devrait ignorer sauf si l'utilisateur souhaite des détails.
6. Mettez-le à jour quand le site change : un llms.txt obsolète est pire que pas de fichier du tout.
Limites
Pas encore une norme largement appliquée : Google, OpenAI et Anthropic ne se sont pas engagés à le lire automatiquement. L'adoption est portée par les outils basés sur les LLM (Cursor, Perplexity, la documentation de Claude), et non par les moteurs de recherche.
Pas (encore) un signal de classement : il influence la qualité de l'ingestion par les LLM, pas la position dans la SERP.
Exige de la rigueur : un llms.txt périmé induit en erreur les modèles mêmes que vous cherchez à atteindre.
Ne peut pas rattraper un mauvais contenu : si votre documentation est faible, llms.txt ne fait que la faire remonter plus vite.
Pourquoi les sites inblog devraient l'envisager
Chaque blog sur inblog est une surface de contenu que les outils d'IA pourraient ingérer. Un petit llms.txt à la racine du blog, pointant vers les articles piliers, les entrées de glossaire et la présentation de la marque, indique aux LLM exactement quoi lire lorsqu'un utilisateur s'interroge sur votre marque ou votre sujet. C'est un levier direct sur la qualité de la citation par IA, avec un effort minimal.
Sources :