llms.txt
llms.txt는 웹사이트 루트(/llms.txt)에 두는 마크다운 파일로, LLM 기반 도구가 사이트의 가장 중요한 콘텐츠를 빠르게 파악할 수 있도록 큐레이션된 지도를 제공합니다. 2024년 제레미 하워드가 제안했고, sitemap.xml이 검색 엔진에 해주는 일을 AI에 해주는 것을 목표로 합니다 — 사이트의 핵심 부분을 기계가 빠르게 소화하게 만들기.
llms.txt는 웹사이트 루트(/llms.txt)에 두는 마크다운 파일로, LLM 기반 도구가 사이트의 가장 중요한 콘텐츠를 빠르게 파악할 수 있도록 큐레이션된 지도를 제공합니다. 2024년 제레미 하워드가 제안했고, sitemap.xml이 검색 엔진에 해주는 일을 AI에 해주는 것을 목표로 합니다 — 사이트의 핵심 부분을 기계가 빠르게 소화하게 만들기.
왜 중요한가
웹을 읽는 LLM은 컨텍스트 윈도우 문제에 부딪힙니다: 마케팅 사이트 하나가 실제 콘텐츠에 도달하기 전에 HTML·CSS·네비게이션 보일러플레이트만으로 20만 토큰을 넘길 수 있습니다. llms.txt는 사이트 소유자가 LLM에게 읽히고 싶은 페이지를 군더더기 없는 마크다운으로 짧게 정리해 이 문제를 해결합니다. 2024년에 Anthropic·Cloudflare·Mintlify·Zapier·Stripe가 llms.txt를 공개했습니다. AI에 제대로 이해되고 인용되고 싶은 브랜드에게 가장 저렴한 고레버리지 GEO 작업이 돼가고 있습니다.
실제 모양
기본 파일:
# inblog
> inblog는 SEO 최적화된 콘텐츠를 위한 AI 블로그 플랫폼입니다.
## 문서
- [시작하기](https://inblog.ai/docs/getting-started): 첫 블로그 만들기
- [SEO 기능](https://inblog.ai/docs/seo): 내장 SEO 최적화
- [AI 초안](https://inblog.ai/docs/ai-drafts): AI 초안 작동 방식
## Optional
- [Changelog](https://inblog.ai/changelog): 제품 업데이트
두 섹션: 헤딩 + 요약, 그다음 용도별로 묶인 큐레이션 링크. Optional 섹션은 LLM이 깊이가 필요할 때만 읽어야 할 콘텐츠입니다.
llms.txt vs robots.txt vs sitemap.xml
| 파일 | 대상 | 목적 |
|---|---|---|
robots.txt | 크롤러 | 크롤하지 말 것 |
sitemap.xml | 검색 엔진 | 인덱싱할 전체 페이지 목록 |
llms.txt | LLM 기반 도구 | 인제스트할 큐레이션·우선순위 콘텐츠 |
robots.txt는 울타리, sitemap.xml은 전화번호부, llms.txt는 큐레이터의 추천 선반입니다. 서로 보완적이며 대체제가 아닙니다.
두 가지 변형
llms.txt: 짧은 큐레이션 지도 — 목차.
llms-full.txt: 링크된 각 페이지의 마크다운 본문을 인라인으로 담아, LLM이 인제스트할 전체 코퍼스를 한 파일에 넣은 확장판. Anthropic·Mintlify 클라이언트의 문서 사이트가 사용합니다.
좋은 llms.txt 작성법
1. 한 줄 포지셔닝으로 시작: H1 뒤의 blockquote. LLM이 브랜드 정체성으로 학습하는 문장입니다.
2. 구조가 아닌 목적으로 그룹화: "Docs"·"Guides"·"API Reference"·"Case Studies" — "카테고리 A"·"카테고리 B"가 아닙니다.
3. 링크 설명은 사실로, 마케팅이 아니라: "내장 SEO 최적화"가 "콘텐츠를 슈퍼차지하세요"보다 낫습니다.
4. 가장 중요한 페이지를 먼저: 컨텍스트가 빠듯한 LLM은 위에서 아래로 읽습니다.
5. Optional은 심층 콘텐츠용: 사용자가 상세를 원할 때만 LLM이 읽어야 할 것들.
6. 사이트 변경 시 갱신: 낡은 llms.txt는 없는 것보다 나쁩니다.
한계
아직 광범위하게 강제되는 표준은 아님: Google·OpenAI·Anthropic이 자동 수집을 약속한 적은 없습니다. 채택은 LLM 툴(Cursor·Perplexity·Claude docs) 중심이지 검색 엔진은 아닙니다.
(아직) 랭킹 신호가 아님: SERP 순위가 아니라 LLM 인제스트 품질에 영향을 줍니다.
규율 필요: 낡은 llms.txt는 바로 그 도달하려는 모델을 오도합니다.
부실한 콘텐츠를 고쳐주지 않음: 문서가 약하면 llms.txt는 그걸 더 빨리 드러낼 뿐입니다.
inblog 사이트가 고려해야 할 이유
inblog의 모든 블로그는 AI 도구가 인제스트할 가능성이 있는 콘텐츠 표면입니다. 블로그 루트의 작은 llms.txt가 — 필러 포스트·용어집·브랜드 소개를 가리키며 — LLM에게 "당신 브랜드·주제에 대해 물어오면 이것들을 읽어라"고 정확히 알려줍니다. 최소 노력으로 AI 인용 품질에 직접 레버를 거는 방법입니다.
Sources:
- The llms.txt Proposal - Jeremy Howard / Answer.AI
- Anthropic docs llms.txt example
- LLMs.txt For AI SEO: Is It A Boost Or A Waste Of Time? - Search Engine Journal
관련 인블로그 게시물
inblog에서 활용하기
inblog는 각 블로그에 대해 llms.txt를 자동 생성해, 사용자의 핵심 포스트와 브랜드 포지셔닝을 LLM이 쉽게 읽을 수 있도록 큐레이션해 루트에 배치합니다. 덕분에 Cursor·Perplexity·Claude 같은 LLM 도구가 블로그를 인제스트할 때, 가장 중요한 글부터 컨텍스트로 담겨 브랜드가 더 정확히 이해·인용됩니다.