GEO

Reescritura de Consultas

La reescritura de consultas es la práctica de transformar la pregunta original de un usuario en una forma mejor adaptada a la recuperación antes de ejecutarla contra un motor de búsqueda, un sistema RAG o una búsqueda con IA. Abarca una variedad de transformaciones: desambiguar preguntas vagas, resolver pronombres, expandir con sinónimos o descomponer en subpreguntas.

La reescritura de consultas es la práctica de transformar la pregunta original de un usuario en una forma mejor adaptada a la recuperación antes de ejecutarla contra un motor de búsqueda, un sistema RAG o una búsqueda con IA. Abarca una variedad de transformaciones: desambiguar preguntas vagas, resolver pronombres, expandir con sinónimos o descomponer en subpreguntas.

Por qué es importante

Las preguntas que los usuarios escriben realmente no están optimizadas para la recuperación. Son dependientes del contexto ("cómo hago esa cosa"), omiten palabras ("inblog cuánto cuesta") o agrupan varias intenciones ("diferencias entre GEO y SEO y qué hacer"). Ejecutarlas directamente contra una base de datos vectorial introduce ruido. La reescritura de consultas mejora notablemente la precisión de la recuperación y la calidad de las citas, y para 2026 es un paso de preprocesamiento estándar en los pipelines RAG de producción.

Técnicas comunes

Expansión de consultas: Añade sinónimos y términos relacionados. "Recomendación de plataforma de blog" se convierte en "recomendación de plataforma de blog CMS WordPress Medium inblog". Aumenta el recall en la búsqueda semántica.

Descomposición de consultas: Divide una pregunta con varias intenciones en subpreguntas. "¿Cuál es la diferencia entre GEO y SEO y cómo respondo?" se convierte en cuatro consultas: "¿Qué es GEO?", "¿Qué es SEO?", "¿Diferencias entre GEO y SEO?", "¿Estrategia de respuesta de GEO?". Está estrechamente relacionada con el query fan-out.

Resolución de correferencia: Usa la conversación previa para reemplazar pronombres con sustantivos explícitos. "¿Cuánto cuesta eso?" se convierte en "¿Cuánto cuesta el plan Business de inblog?".

HyDE (Hypothetical Document Embeddings): El modelo genera primero una respuesta hipotética a la pregunta y luego incrusta esa respuesta para la recuperación. Las respuestas son estructuralmente más similares a documentos reales que las preguntas, lo que mejora la precisión de la recuperación.

Reformulación de consultas: Reescribe preguntas vagas como otras más claras. "No funciona" se convierte en "¿Por qué mi entrada de blog no aparece en la búsqueda después de publicarla?".

Traducción entre idiomas: Aunque el usuario pregunte en coreano, el sistema también ejecuta la versión traducida al inglés para sacar a la luz documentos en inglés.

El pipeline

  1. Entrada de la consulta del usuario: Recibir la pregunta original en lenguaje natural
  2. Reescritura con LLM: Un prompt dedicado analiza la consulta y genera la(s) forma(s) reescrita(s)
  3. Embedding: Cada consulta reescrita se incrusta
  4. Búsqueda vectorial: Recuperar los fragmentos relevantes de la base de datos vectorial
  5. Reranking: Refinar los resultados con un reranker
  6. Generación: Introducir los mejores fragmentos en el LLM para obtener la respuesta final

Implicaciones para GEO

La consulta que escribe un usuario y la consulta reescrita que realmente llega a la base de datos vectorial son diferentes. La estrategia de GEO debe diseñar contenido que también coincida con las consultas reescritas.

Encabezados en forma de pregunta: Usar encabezados como "¿Qué es X?", "Cómo hacer Y", "Diferencia entre X e Y" coincide directamente con las subpreguntas descompuestas.

Sinónimos y términos bilingües: Proporcionar tanto nombres propios como términos genéricos, inglés junto a los nombres locales, y tanto formas expandidas como abreviaturas ayuda a captar las expansiones de consultas.

Frases de respuesta explícitas: Iniciar cada sección con una afirmación del tipo "X es..." coincide con las respuestas hipotéticas que genera HyDE.

Contenido comparativo: Las entradas estructuradas como "A vs B" coinciden de forma natural con varias subpreguntas a la vez cuando se descomponen las consultas comparativas.

Sources: