id, title, type, tags, sources, last_updated
| id |
title |
type |
tags |
sources |
last_updated |
| vector-search |
向量检索 |
concept |
|
|
2026-04-16 |
Definition
向量检索(Vector Search / Similarity Search)是根据语义相似度在向量数据库中检索相关文档的技术,核心是比较查询向量与文档向量的"距离"(余弦相似度),而非字面匹配。
Mechanism
- Query 通过 Embedding 模型转为固定长度向量
- 在 向量数据库(如 Qdrant)中按余弦相似度检索 Top-K 最接近的向量
- 返回对应的文档块作为 RAG 的 Context
Key Parameters
- Top-K:返回最相似的 K 个结果(K=3~10 常见)
- 相似度阈值:过滤低于某分数的结果
- Reranking:初筛后用更大模型重新排序(如 BGE-Reranker)
Connections
- RAG ← 核心阶段(Retrieval 阶段的具体技术)
- Qdrant ← 存储层
- Embedding ← 依赖(Query 和文档均需向量化)
- 语义搜索 ← 同类技术(前者基于向量,后者可结合 BM25/关键词)
- 混合搜索 ← 扩展(向量检索 + BM25 关键词检索融合排序)
Advantage over Keyword Search
| 维度 |
关键词搜索 |
向量检索 |
| 匹配方式 |
字面匹配 |
语义相似度 |
| 同义词处理 |
无法识别 |
天然处理 |
| 歧义词处理 |
精确但机械 |
需依赖高质量 Embedding |
| 适用场景 |
精确查询 |
语义模糊查询 |