GEO

쿼리 재작성

쿼리 재작성(Query Rewriting)은 검색 엔진·RAG 시스템·AI 검색 엔진이 사용자의 원본 질문을 그대로 검색에 사용하지 않고, 검색에 더 적합한 형태로 바꾸는 기술입니다. 모호한 질문을 구체화하거나, 대명사를 풀거나, 동의어로 확장하거나, 여러 하위 질문으로 분해하는 등 다양한 변형이 포함됩니다.

쿼리 재작성(Query Rewriting)은 검색 엔진·RAG 시스템·AI 검색 엔진이 사용자의 원본 질문을 그대로 검색에 사용하지 않고, 검색에 더 적합한 형태로 바꾸는 기술입니다. 모호한 질문을 구체화하거나, 대명사를 풀거나, 동의어로 확장하거나, 여러 하위 질문으로 분해하는 등 다양한 변형이 포함됩니다.

왜 중요한가

사용자가 입력하는 질문은 일반적으로 검색에 최적화되어 있지 않습니다. "그거 어떻게 하는지 알려줘"처럼 맥락 의존적이거나, "inblog 얼마야"처럼 단어가 생략되어 있거나, "GEO vs SEO 차이"처럼 비교 의도가 명확한 여러 하위 질문을 포함합니다. AI 검색 엔진이 이 질문을 그대로 벡터 DB에 넣으면 관련 없는 결과가 섞이기 쉽습니다. 쿼리 재작성은 검색 정확도·인용 품질을 크게 개선하는 핵심 단계로, 2026년 RAG 파이프라인의 표준 전처리가 되었습니다.

대표적인 쿼리 재작성 기법

쿼리 확장(Query Expansion): 원본 쿼리에 동의어·연관어를 추가합니다. "블로그 플랫폼 추천"이 "블로그 플랫폼 추천 CMS 워드프레스 미디엄 inblog"로 확장됩니다. 의미 기반 검색의 리콜을 높입니다.

쿼리 분해(Query Decomposition): 복합 질문을 여러 하위 질문으로 나눕니다. "GEO와 SEO의 차이는 뭐고 어떻게 대응해야 해?"는 "GEO란?", "SEO란?", "GEO와 SEO의 차이", "GEO 대응 전략" 4개로 분해됩니다. Query Fan-out과 유사한 개념입니다.

대명사 해소(Coreference Resolution): 이전 대화 맥락을 참고해 대명사를 구체적 명사로 대체합니다. "그거 가격 얼마야"가 "inblog Business 플랜 가격 얼마야"로 재작성됩니다.

하이드(HyDE, Hypothetical Document Embeddings): 모델이 먼저 '이 질문에 대한 가상의 답변'을 생성하고, 그 답변의 임베딩으로 검색합니다. 질문보다 답변이 실제 문서와 더 유사하기 때문에 검색 정확도가 상승합니다.

쿼리 재구성(Query Reformulation): 모호한 질문을 명확한 질문으로 다시 씁니다. "잘 안 돼"가 "블로그 포스트 발행 후 검색에 노출되지 않는 원인"으로 재구성됩니다.

다국어 변환: 사용자가 한국어로 질문해도 영어 문서를 검색하기 위해 영어로 번역한 쿼리를 병행 실행합니다.

작동 파이프라인

  1. 사용자 쿼리 입력: 자연어 그대로 수신
  2. LLM 재작성 단계: 전용 프롬프트로 쿼리를 분석해 재작성된 형태를 생성
  3. 임베딩 생성: 재작성된 쿼리(들)를 각각 임베딩
  4. 벡터 검색: 벡터 DB에서 관련 청크 회수
  5. 리랭킹: 리랭커로 결과 정제
  6. LLM 응답 생성: 최종 청크를 컨텍스트로 주입해 답변 생성

GEO 관점의 시사점

사용자가 블로그를 찾기 위해 검색에 입력하는 쿼리와, AI 검색이 실제로 벡터 DB에 던지는 재작성된 쿼리는 다릅니다. GEO 전략은 이 '재작성된 쿼리'에도 매칭되도록 콘텐츠를 설계해야 합니다.

질문형 소제목: "~는 무엇인가", "~하는 방법", "~의 차이" 같은 질문 형태를 본문 소제목으로 사용하면 재작성된 하위 질문과 직접 매칭됩니다.

동의어와 병기: 고유명사와 일반어, 영어 병기, 축약과 풀어쓰기를 함께 제공해 쿼리 확장 결과에 걸리도록 합니다.

명시적 답변 문장: 각 섹션의 첫 문장을 "X는 ~입니다" 같은 단정형으로 시작하면 HyDE가 생성할 가상 답변과 구조적으로 유사해 매칭률이 올라갑니다.

비교 콘텐츠: 비교 의도 쿼리가 분해될 때 자주 등장하는 'A vs B' 구조의 포스트는 재작성된 여러 하위 질문에 동시에 매칭됩니다.

Sources:

관련 인블로그 게시물

inblog에서 활용하기

inblog 에디터에서 포스트 제목과 ### 소제목을 '실제 사용자가 쓸 법한 질문 형태'로 작성하면, AI 검색이 쿼리를 재작성해 하위 질문으로 분해했을 때 해당 포스트의 섹션이 직접 매칭됩니다. 결과적으로 하나의 포스트가 여러 재작성 쿼리에 동시에 노출되어 AI 검색 인용 빈도가 크게 상승합니다.