llms.txt
llms.txt é um arquivo markdown proposto, servido na raiz de um site - /llms.txt -, que oferece às ferramentas baseadas em LLM um mapa curado e condensado do conteúdo mais importante de um site. Proposto por Jeremy Howard em 2024, ele busca fazer pela IA o que o sitemap.xml fez pela busca: tornar as melhores partes do seu site descobríveis e digeríveis na velocidade da máquina.
llms.txt é um arquivo markdown proposto, servido na raiz de um site - /llms.txt -, que oferece às ferramentas baseadas em LLM um mapa curado e condensado do conteúdo mais importante de um site. Proposto por Jeremy Howard em 2024, ele busca fazer pela IA o que o sitemap.xml fez pela busca: tornar as melhores partes do seu site descobríveis e digeríveis na velocidade da máquina.
Por Que Importa
Os LLMs que leem a web enfrentam um problema de janela de contexto: um único site de marketing pode ultrapassar 200 mil tokens de HTML, CSS e código repetitivo de navegação antes que o modelo chegue ao conteúdo de fato. O llms.txt resolve isso fornecendo uma lista curta e curada das páginas que o dono do site quer que um LLM leia, escrita em markdown limpo e sem excessos. Anthropic, Cloudflare, Mintlify, Zapier e Stripe publicaram arquivos llms.txt em 2024. Para marcas que querem ser entendidas e citadas corretamente pela IA, ele está se tornando a ação de GEO de maior alavancagem e menor custo.
Como Ele É
Um arquivo básico:
# inblog
> inblog is an AI-powered blogging platform for SEO-optimized content.
## Docs
- [Getting started](https://inblog.ai/docs/getting-started): Create your first blog
- [SEO features](https://inblog.ai/docs/seo): Built-in SEO optimization
- [AI drafting](https://inblog.ai/docs/ai-drafts): How AI drafts work
## Optional
- [Changelog](https://inblog.ai/changelog): Product updates
Duas seções: um título + resumo, depois links curados agrupados por finalidade. A seção Optional lista conteúdo que um LLM deve ler apenas se for necessário maior profundidade.
llms.txt vs robots.txt vs sitemap.xml
| Arquivo | Público | Finalidade |
|---|---|---|
robots.txt | Crawlers | O que não rastrear |
sitemap.xml | Mecanismos de busca | Lista completa de páginas a indexar |
llms.txt | Ferramentas baseadas em LLM | Conteúdo curado e priorizado para ingestão |
O robots.txt é uma cerca. O sitemap.xml é uma lista telefônica. O llms.txt é a prateleira de recomendações de um curador. Eles são complementares, não substitutos.
Duas Variantes
llms.txt: o mapa curado e curto - o sumário.
llms-full.txt: uma versão expandida em que o conteúdo markdown de cada página vinculada é incorporado inline, dando ao LLM todo o corpus passível de ingestão em um único arquivo. Usado por sites de documentação como os da Anthropic e os clientes da Mintlify.
Como Escrever um Bom llms.txt
1. Comece com uma declaração de posicionamento em uma linha: a citação em bloco após o H1. É o que o LLM aprende sobre a identidade da sua marca.
2. Agrupe por finalidade, não por estrutura: "Docs", "Guias", "Referência de API", "Estudos de Caso" - não "Categoria A", "Categoria B".
3. Escreva as descrições dos links como fatos, não como marketing: "Otimização de SEO integrada" é melhor do que "Turbine seu conteúdo".
4. Coloque as páginas mais importantes primeiro: LLMs sob pressão de contexto leem de cima para baixo.
5. Use Optional para conteúdo aprofundado: coisas que o LLM deve pular, a menos que o usuário queira detalhes.
6. Atualize-o quando o site mudar: um llms.txt desatualizado é pior do que nenhum.
Limitações
Ainda não é um padrão amplamente adotado: Google, OpenAI e Anthropic não se comprometeram a lê-lo automaticamente. A adoção é impulsionada por ferramentas de LLM (Cursor, Perplexity, a documentação do Claude), não por mecanismos de busca.
Não é um sinal de ranking (ainda): ele afeta a qualidade da ingestão por LLMs, não a posição na SERP.
Exige disciplina: um llms.txt obsoleto induz ao erro justamente os modelos que você está tentando alcançar.
Não conserta conteúdo ruim: se a sua documentação for fraca, o llms.txt apenas a expõe mais rápido.
Por Que Sites no inblog Deveriam Considerá-lo
Todo blog no inblog é uma superfície de conteúdo que ferramentas de IA podem ingerir. Um pequeno llms.txt na raiz do blog - apontando para posts pilar, entradas de glossário e a apresentação da marca - diz aos LLMs exatamente o que ler quando um usuário pergunta sobre a sua marca ou tópico. É uma alavanca direta sobre a qualidade da citação por IA com esforço mínimo.
Fontes: