Reescrita de Consultas
A reescrita de consultas (query rewriting) e a pratica de transformar a pergunta bruta do usuario em uma forma mais adequada para recuperacao antes de executa-la contra um mecanismo de busca, um sistema RAG ou a busca por IA. Ela abrange uma variedade de transformacoes: desambiguar perguntas vagas, resolver pronomes, expandir com sinonimos ou decompor em subperguntas.
A reescrita de consultas (query rewriting) e a pratica de transformar a pergunta bruta do usuario em uma forma mais adequada para recuperacao antes de executa-la contra um mecanismo de busca, um sistema RAG ou a busca por IA. Ela abrange uma variedade de transformacoes: desambiguar perguntas vagas, resolver pronomes, expandir com sinonimos ou decompor em subperguntas.
Por que importa
As perguntas que os usuarios realmente digitam nao sao otimizadas para recuperacao. Elas dependem de contexto ("como eu faco aquela coisa"), omitem palavras ("inblog quanto custa") ou empacotam multiplas intencoes ("diferencas entre GEO e SEO e o que fazer"). Rodar isso diretamente contra um banco de dados vetorial traz ruido. A reescrita de consultas melhora drasticamente a precisao da recuperacao e a qualidade das citacoes e, ate 2026, e uma etapa de pre-processamento padrao em pipelines RAG de producao.
Tecnicas comuns
Expansao de consulta: adicionar sinonimos e termos relacionados. "Recomendacao de plataforma de blog" se torna "recomendacao de plataforma de blog CMS WordPress Medium inblog". Aumenta o recall na busca semantica.
Decomposicao de consulta: dividir uma pergunta com multiplas intencoes em subperguntas. "Qual e a diferenca entre GEO e SEO e como eu respondo?" se torna quatro consultas: "O que e GEO?", "O que e SEO?", "Diferencas entre GEO e SEO?", "Estrategia de resposta para GEO?" Esta intimamente relacionada ao query fan-out.
Resolucao de correferencia: usar a conversa anterior para substituir pronomes por substantivos explicitos. "Quanto custa isso?" se torna "Quanto custa o plano Business do inblog?"
HyDE (Hypothetical Document Embeddings): o modelo gera primeiro uma resposta hipotetica para a pergunta e, em seguida, faz o embedding dessa resposta para a recuperacao. Respostas sao estruturalmente mais parecidas com documentos reais do que perguntas, aumentando a precisao da recuperacao.
Reformulacao de consulta: reescrever perguntas vagas em outras mais claras. "Nao esta funcionando" se torna "Por que meu post de blog nao aparece na busca depois de publicado?"
Traducao entre idiomas: mesmo que o usuario pergunte em portugues, o sistema tambem executa a versao traduzida em ingles para trazer documentos em ingles a tona.
O pipeline
- Entrada da consulta do usuario: receber a pergunta bruta em linguagem natural
- Reescrita pelo LLM: um prompt dedicado analisa a consulta e gera a(s) forma(s) reescrita(s)
- Embedding: cada consulta reescrita recebe um embedding
- Busca vetorial: recuperar os chunks relevantes do banco de dados vetorial
- Reranking: refinar os resultados com um reranker
- Geracao: alimentar os melhores chunks no LLM para a resposta final
Implicacoes para o GEO
A consulta que o usuario digita e a consulta reescrita que de fato chega ao banco de dados vetorial sao diferentes. A estrategia de GEO precisa projetar conteudo que tambem corresponda as consultas reescritas.
Titulos em formato de pergunta: usar titulos como "O que e X?", "Como fazer Y?", "Diferenca entre X e Y" corresponde diretamente as subperguntas decompostas.
Sinonimos e termos bilingues: fornecer tanto nomes proprios quanto termos genericos, ingles ao lado de nomes locais, e tanto formas expandidas quanto abreviacoes ajuda a captar as expansoes de consulta.
Frases de resposta explicitas: comecar cada secao com uma afirmacao declarativa "X e..." corresponde as respostas hipoteticas que o HyDE gera.
Conteudo comparativo: posts estruturados como "A vs B" correspondem naturalmente a varias subperguntas de uma vez quando consultas comparativas sao decompostas.
Fontes: