GEO

Переписывание запросов (Query Rewriting)

Переписывание запросов - это практика преобразования исходного вопроса пользователя в форму, более подходящую для поиска, перед тем как направить его в поисковую систему, систему RAG или AI-поиск. Оно охватывает целый ряд преобразований: устранение неоднозначности расплывчатых вопросов, разрешение местоимений, расширение синонимами или разбиение на подвопросы.

Переписывание запросов - это практика преобразования исходного вопроса пользователя в форму, более подходящую для поиска, перед тем как направить его в поисковую систему, систему RAG или AI-поиск. Оно охватывает целый ряд преобразований: устранение неоднозначности расплывчатых вопросов, разрешение местоимений, расширение синонимами или разбиение на подвопросы.

Почему это важно

Вопросы, которые пользователи реально набирают, не оптимизированы для поиска. Они зависят от контекста ("как мне сделать вот это"), содержат пропуски слов ("inblog сколько"), или объединяют несколько намерений ("различия GEO и SEO и что делать"). Если направить их напрямую в векторную БД, это притянет шум. Переписывание запросов резко повышает точность поиска и качество цитирования, и к 2026 году оно стало стандартным этапом предобработки в продакшен-конвейерах RAG.

Распространённые методы

Расширение запроса (query expansion): добавление синонимов и связанных терминов. "Рекомендация блог-платформы" превращается в "рекомендация блог-платформы CMS WordPress Medium inblog". Повышает полноту в семантическом поиске.

Декомпозиция запроса: разбиение вопроса с несколькими намерениями на подвопросы. "В чём разница между GEO и SEO и как мне реагировать?" превращается в четыре запроса: "Что такое GEO?", "Что такое SEO?", "Различия GEO и SEO?", "Стратегия реагирования на GEO?" Тесно связано с веерным разворачиванием запроса.

Разрешение кореференции: использование предыдущего диалога для замены местоимений явными существительными. "Сколько это стоит?" превращается в "Сколько стоит план inblog Business?"

HyDE (Hypothetical Document Embeddings): модель сначала генерирует гипотетический ответ на вопрос, а затем встраивает этот ответ для поиска. Ответы структурно более похожи на реальные документы, чем вопросы, что повышает точность поиска.

Переформулирование запроса: переписывание расплывчатых вопросов в более ясные. "Не работает" превращается в "Почему мой пост в блоге не появляется в поиске после публикации?"

Межъязыковой перевод: даже если пользователь спрашивает на корейском, система также запускает переведённую английскую версию, чтобы вывести англоязычные документы.

Конвейер

  1. Ввод запроса пользователя: получение исходного вопроса на естественном языке
  2. Переписывание с помощью LLM: специальный промпт анализирует запрос и генерирует переписанную форму (или формы)
  3. Встраивание: каждый переписанный запрос преобразуется во встраивание
  4. Векторный поиск: извлечение релевантных фрагментов из векторной БД
  5. Реранжирование: уточнение результатов с помощью реранкера
  6. Генерация: подача лучших фрагментов в LLM для формирования окончательного ответа

Значение для GEO

Запрос, который набирает пользователь, и переписанный запрос, который реально попадает в векторную БД, - это разные вещи. Стратегия GEO должна проектировать контент так, чтобы он соответствовал и переписанным запросам.

Заголовки в форме вопросов: использование заголовков вида "Что такое X?", "Как сделать Y?", "Разница между X и Y" напрямую соответствует декомпозированным подвопросам.

Синонимы и двуязычные термины: указание как собственных имён, так и общих терминов, английских названий рядом с местными, а также как полных форм, так и сокращений помогает попасть под расширения запроса.

Явные ответные предложения: начало каждого раздела с утвердительного "X - это..." соответствует гипотетическим ответам, которые генерирует HyDE.

Сравнительный контент: посты со структурой "A против B" естественно соответствуют сразу нескольким подвопросам, когда сравнительные запросы декомпозируются.

Источники: