llms.txt
llms.txt es un archivo markdown propuesto que se sirve en la raíz de un sitio web (/llms.txt) y que ofrece a las herramientas basadas en LLM un mapa curado y condensado del contenido más importante de un sitio. Propuesto por Jeremy Howard en 2024, su objetivo es hacer por la AI lo que sitemap.xml hizo por la búsqueda: hacer que las mejores partes de tu sitio sean detectables y digeribles a velocidad de máquina.
llms.txt es un archivo markdown propuesto que se sirve en la raíz de un sitio web (/llms.txt) y que ofrece a las herramientas basadas en LLM un mapa curado y condensado del contenido más importante de un sitio. Propuesto por Jeremy Howard en 2024, su objetivo es hacer por la AI lo que sitemap.xml hizo por la búsqueda: hacer que las mejores partes de tu sitio sean detectables y digeribles a velocidad de máquina.
Por qué importa
Los LLM que leen la web se enfrentan a un problema de ventana de contexto: un solo sitio de marketing puede superar los 200 000 tokens de HTML, CSS y elementos de navegación antes de que el modelo llegue al contenido real. llms.txt lo resuelve proporcionando una lista breve y curada de las páginas que el propietario del sitio quiere que lea un LLM, escrita en markdown limpio y sin elementos superfluos. Anthropic, Cloudflare, Mintlify, Zapier y Stripe publicaron archivos llms.txt en 2024. Para las marcas que quieren ser comprendidas y citadas correctamente por la AI, se está convirtiendo en la jugada de GEO de mayor apalancamiento y menor coste.
Qué aspecto tiene
Un archivo básico:
# inblog
> inblog is an AI-powered blogging platform for SEO-optimized content.
## Docs
- [Getting started](https://inblog.ai/docs/getting-started): Create your first blog
- [SEO features](https://inblog.ai/docs/seo): Built-in SEO optimization
- [AI drafting](https://inblog.ai/docs/ai-drafts): How AI drafts work
## Optional
- [Changelog](https://inblog.ai/changelog): Product updates
Dos secciones: un encabezado y un resumen, y luego enlaces curados agrupados por propósito. La sección Optional enumera el contenido que un LLM debería leer solo si se necesita profundidad.
llms.txt vs robots.txt vs sitemap.xml
| Archivo | Audiencia | Propósito |
|---|---|---|
robots.txt | Rastreadores | Qué no rastrear |
sitemap.xml | Motores de búsqueda | Lista completa de páginas que indexar |
llms.txt | Herramientas basadas en LLM | Contenido curado y priorizado para su procesamiento |
robots.txt es una valla. sitemap.xml es una guía telefónica. llms.txt es la estantería de recomendaciones de un curador. Son complementarios, no sustitutos.
Dos variantes
llms.txt: el mapa corto y curado, la tabla de contenidos.
llms-full.txt: una versión ampliada en la que el contenido markdown de cada página enlazada se incrusta en línea, dando a un LLM todo el corpus procesable en un solo archivo. Lo usan sitios de documentación como los de Anthropic y los clientes de Mintlify.
Cómo redactar un buen llms.txt
1. Empieza con una declaración de posicionamiento de una línea: la cita en bloque tras el H1. Es lo que el LLM aprende sobre la identidad de tu marca.
2. Agrupa por propósito, no por estructura: "Docs", "Guías", "Referencia de la API", "Casos de estudio", no "Categoría A", "Categoría B".
3. Escribe las descripciones de los enlaces como hechos, no como marketing: "Optimización de SEO integrada" supera a "Potencia tu contenido".
4. Coloca primero las páginas más importantes: los LLM bajo presión de contexto leen de arriba abajo.
5. Usa Optional para el contenido más específico: cosas que el LLM debería omitir a menos que el usuario quiera detalle.
6. Actualízalo cuando el sitio cambie: un llms.txt desactualizado es peor que ninguno.
Limitaciones
Aún no es un estándar ampliamente aplicado: Google, OpenAI y Anthropic no se han comprometido a leerlo automáticamente. La adopción está impulsada por las herramientas de LLM (Cursor, Perplexity, la documentación de Claude), no por los motores de búsqueda.
Aún no es una señal de posicionamiento: afecta a la calidad del procesamiento por parte del LLM, no a la posición en la SERP.
Requiere disciplina: un llms.txt obsoleto confunde a los mismísimos modelos que intentas alcanzar.
No puede arreglar el mal contenido: si tu documentación es pobre, llms.txt solo la expone más rápido.
Por qué los sitios de inblog deberían considerarlo
Cada blog en inblog es una superficie de contenido que las herramientas de AI podrían procesar. Un pequeño llms.txt en la raíz del blog, que apunte a las entradas pilar, las entradas del glosario y la presentación de la marca, indica a los LLM exactamente qué leer cuando un usuario pregunta sobre tu marca o tema. Es una palanca directa sobre la calidad de la citación por AI con un esfuerzo mínimo.
Sources: