GEO

Búsqueda híbrida

La búsqueda híbrida es una técnica de recuperación que ejecuta en paralelo una búsqueda vectorial densa (semántica) y una búsqueda dispersa por palabras clave (BM25), y después fusiona los resultados en una única lista ordenada. Capta tanto la "similitud de significado" como la "coincidencia exacta de tokens" en una sola consulta.

La búsqueda híbrida es una técnica de recuperación que ejecuta en paralelo una búsqueda vectorial densa (semántica) y una búsqueda dispersa por palabras clave (BM25), y después fusiona los resultados en una única lista ordenada. Capta tanto la "similitud de significado" como la "coincidencia exacta de tokens" en una sola consulta.

Por qué importa

La búsqueda vectorial densa es excelente para las coincidencias semánticas ("portátiles económicos" ≈ "ordenadores baratos"), pero falla con tokens poco frecuentes como códigos de producto, SKU y nombres propios. La búsqueda por palabras clave acierta con los tokens exactos, pero pasa por alto las paráfrasis. La búsqueda híbrida gana en ambos casos: los sistemas de RAG en producción de Anthropic, OpenAI y Elastic informan de que la híbrida supera de forma constante a cualquiera de las dos por separado, normalmente con una mejora de la exhaustividad del 10 % al 30 % en pruebas comparativas de recuperación del mundo real.

Cómo funciona

1. Recuperación dual: La misma consulta se ejecuta a través de ambos índices: un índice vectorial (incrustaciones densas) y un índice invertido (BM25 o TF-IDF).

2. Normalización de puntuaciones: Las puntuaciones densas y dispersas viven en escalas distintas. Se normalizan mediante mín.-máx., puntuación z o por rango.

3. Fusión: Las puntuaciones se combinan en una única clasificación. Los métodos más populares:

  • Fusión de rango recíproco (RRF): score = Σ 1/(k + rank_i), basada en el rango, no requiere ajuste y es extremadamente robusta.
  • Suma ponderada: α * dense + (1-α) * sparse, requiere ajustar α por dominio.
  • Fusión aprendida: Un modelo pequeño predice el peso óptimo por consulta.

4. Reordenación opcional: Un codificador cruzado reordena los k mejores candidatos fusionados para una precisión final.

Cuándo utilizarla

Vocabulario específico del dominio: Códigos médicos, citas legales, números de pieza.

Tipos de consulta mixtos: Cuando los usuarios buscan tanto con lenguaje natural como con cadenas exactas.

Importa la exhaustividad de la cola larga: Consultas poco frecuentes en las que BM25 sigue brillando.

Obtienes cero resultados solo con los vectores: A menudo es un fallo de coincidencia exacta; la híbrida lo soluciona.

Compromisos

Latencia: Dos índices significan dos consultas. Se mitiga con la ejecución en paralelo.

Almacenamiento de índices: Necesitas mantener tanto un índice vectorial como un índice invertido.

Complejidad de ajuste: La fusión ponderada requiere datos etiquetados para el ajuste. La RRF lo evita.

No siempre es una ventaja: En dominios donde las incrustaciones son muy fuertes (tareas de pura paráfrasis), la densa por sí sola puede igualar a la híbrida.

Búsqueda híbrida vs. búsqueda vectorial pura

AspectoVectorial puraHíbrida
Coincidencias semánticasFuerteFuerte
Coincidencias exactas de tokensDébilFuerte
Tokens poco frecuentes, SKUDébilFuerte
InfraestructuraSencillaDos índices
Mejora típica de la exhaustividadReferencia+10 % a +30 %

Las bases de datos vectoriales modernas (Pinecone, Weaviate, Qdrant, Elasticsearch) ofrecen la búsqueda híbrida como una funcionalidad de primer nivel, por lo que el costo operativo es bajo.

Sources: