Что такое векторная база данных? | Глоссарий GEO

Векторная база данных - это специализированная база данных, спроектированная для хранения векторов эмбеддингов и быстрого извлечения наиболее семантически близких из них. Сейчас это базовая инфраструктура для пайплайнов RAG, семантического поиска, рекомендательных систем и долговременной памяти ИИ-агентов.

Почему это важно

Традиционные SQL-базы оптимизированы под точные совпадения по ключевым словам, но поиск эпохи LLM работает на семантическом сходстве. Найти топ-k ближайших соседей среди миллионов векторов (каждый размерностью 1000+) за несколько миллисекунд практически невозможно на универсальной БД. Векторные базы данных решают это с помощью алгоритмов приближённого поиска ближайших соседей (ANN), обеспечивая извлечение в реальном времени, на которое опираются ответы LLM.

Как это работает

Генерация эмбеддингов: Модели вроде OpenAI и Cohere превращают текст или изображения в векторы.
Индексирование: Алгоритмы ANN, такие как HNSW, IVF или PQ, структурируют векторы для быстрого извлечения.
Эмбеддинг запроса: Запрос пользователя векторизуется той же моделью.
Поиск по сходству: Топ-k векторов возвращаются по косинусному сходству, скалярному произведению или евклидову расстоянию.
Соединение с метаданными: Исходный текст и метаданные, прикреплённые к каждому вектору, возвращаются и встраиваются в контекст LLM.

Ведущие решения

Выделенные векторные БД:

Pinecone: Управляемый сервис, простой API, быстрый старт
Weaviate: Открытый исходный код, сильный гибридный (вектор + ключевые слова) поиск
Qdrant: На Rust, высокая производительность, низкое потребление ресурсов
Milvus: Распределённый векторный поиск в масштабе

Векторные расширения для существующих БД:

pgvector: Расширение PostgreSQL - хранит векторы рядом с SQL-данными
Elasticsearch: Сочетает поиск по ключевым словам с векторным поиском
Redis: Векторный поиск в памяти

Распространённый паттерн: начать с pgvector, перейти на выделенную БД, когда этого потребуют трафик и масштаб.

Критерии выбора

Размер данных: До 1 млн векторов pgvector подходит. Свыше 100 млн векторов выделенная БД обязательна.

Гибридный поиск: Если нужны вектор + ключевые слова + фильтр вместе, блистают Weaviate или Elasticsearch.

Задержка: Приложения для пользователей нацелены на p99 <= 100 мс. Индексы HNSW наиболее надёжны в этом диапазоне.

Операционная нагрузка: Управляемые сервисы вроде Pinecone стоят дороже, но почти полностью снимают инфраструктурную работу. Открытый исходный код (Qdrant, Milvus) - наоборот.

Фильтрация по метаданным: Если предфильтрация по категории, дате или ID пользователя частая, выбирайте решение, которое эффективно сочетает её с векторным поиском.

Последствия для GEO

Операторы блогов редко строят собственные векторные БД, но писать контент так, чтобы он хорошо укладывался внутри векторных баз LLM и ИИ-поиска, важно. Ясные заголовки, самодостаточные абзацы, конкретные цифры и источники повышают качество эмбеддингов - а значит, и оценки сходства, когда векторные БД выбирают, что цитировать.

Источники:

Vector Database

Почему это важно

Как это работает

Ведущие решения

Критерии выбора

Последствия для GEO