Réécriture de requête
La réécriture de requête est la pratique qui consiste à transformer la question brute d'un utilisateur en une forme mieux adaptée à la recherche avant de l'exécuter sur un moteur de recherche, un système RAG ou une recherche IA. Elle couvre toute une gamme de transformations : lever l'ambiguïté de questions vagues, résoudre les pronoms, étendre avec des synonymes ou décomposer en sous-questions.
La réécriture de requête est la pratique qui consiste à transformer la question brute d'un utilisateur en une forme mieux adaptée à la recherche avant de l'exécuter sur un moteur de recherche, un système RAG ou une recherche IA. Elle couvre toute une gamme de transformations : lever l'ambiguïté de questions vagues, résoudre les pronoms, étendre avec des synonymes ou décomposer en sous-questions.
Pourquoi c'est important
Les questions que les utilisateurs tapent réellement ne sont pas optimisées pour la recherche. Elles dépendent du contexte ("comment je fais ce truc"), omettent des mots ("inblog combien"), ou regroupent plusieurs intentions ("différences GEO vs SEO et quoi faire"). Les exécuter directement sur une base de données vectorielle ramène du bruit. La réécriture de requête améliore nettement la précision de la recherche et la qualité des citations, et d'ici 2026, c'est une étape de prétraitement standard dans les pipelines RAG en production.
Techniques courantes
Expansion de requête : ajouter des synonymes et des termes connexes. "Recommandation de plateforme de blog" devient "recommandation de plateforme de blog CMS WordPress Medium inblog". Augmente le rappel dans la recherche sémantique.
Décomposition de requête : diviser une question multi-intentions en sous-questions. "Quelle est la différence entre le GEO et le SEO et comment y répondre ?" devient quatre requêtes : "Qu'est-ce que le GEO ?", "Qu'est-ce que le SEO ?", "Différences GEO vs SEO ?", "Stratégie de réponse au GEO ?" Étroitement liée au query fan-out.
Résolution de coréférence : utiliser la conversation précédente pour remplacer les pronoms par des noms explicites. "Combien ça coûte ?" devient "Combien coûte le plan Business d'inblog ?"
HyDE (Hypothetical Document Embeddings) : le modèle génère d'abord une réponse hypothétique à la question, puis l'intègre pour la recherche. Les réponses sont structurellement plus proches de vrais documents que les questions, ce qui améliore la précision de la recherche.
Reformulation de requête : réécrire des questions vagues en questions plus claires. "Ça ne marche pas" devient "Pourquoi mon article de blog n'apparaît-il pas dans la recherche après publication ?"
Traduction interlingue : même si l'utilisateur pose sa question en coréen, le système exécute aussi la version anglaise traduite pour faire remonter des documents en anglais.
Le pipeline
- Saisie de la requête utilisateur : recevoir la question brute en langage naturel
- Réécriture par le LLM : un prompt dédié analyse la requête et génère la ou les formes réécrites
- Embedding : chaque requête réécrite est intégrée
- Recherche vectorielle : récupérer les fragments pertinents depuis la base de données vectorielle
- Reranking : affiner les résultats avec un reranker
- Génération : transmettre les meilleurs fragments au LLM pour la réponse finale
Implications pour le GEO
La requête que tape un utilisateur et la requête réécrite qui atteint réellement la base de données vectorielle sont différentes. La stratégie GEO doit concevoir un contenu qui correspond aussi aux requêtes réécrites.
Titres en forme de question : utiliser des titres comme "Qu'est-ce que X ?", "Comment faire Y ?", "Différence entre X et Y" correspond directement aux sous-questions décomposées.
Synonymes et termes bilingues : fournir à la fois les noms propres et les termes génériques, l'anglais aux côtés des noms locaux, et à la fois les formes développées et les abréviations vous aide à capter les expansions de requête.
Phrases de réponse explicites : commencer chaque section par un "X est…" déclaratif correspond aux réponses hypothétiques que génère HyDE.
Contenu comparatif : les articles structurés "A vs B" correspondent naturellement à plusieurs sous-questions à la fois lorsque les requêtes comparatives sont décomposées.
Sources :