--- id: vector-search title: 向量检索 type: concept tags: [信息检索, 向量数据库] sources: ["RAG从入门到精通系列1:基础RAG.md"] last_updated: 2026-04-16 --- ## Definition 向量检索(Vector Search / Similarity Search)是根据语义相似度在向量数据库中检索相关文档的技术,核心是比较查询向量与文档向量的"距离"(余弦相似度),而非字面匹配。 ## Mechanism 1. Query 通过 [[Embedding]] 模型转为固定长度向量 2. 在 [[向量数据库]](如 [[Qdrant]])中按余弦相似度检索 Top-K 最接近的向量 3. 返回对应的文档块作为 [[RAG]] 的 Context ## Key Parameters - **Top-K**:返回最相似的 K 个结果(K=3~10 常见) - **相似度阈值**:过滤低于某分数的结果 - **Reranking**:初筛后用更大模型重新排序(如 BGE-Reranker) ## Connections - [[RAG]] ← 核心阶段(Retrieval 阶段的具体技术) - [[Qdrant]] ← 存储层 - [[Embedding]] ← 依赖(Query 和文档均需向量化) - [[语义搜索]] ← 同类技术(前者基于向量,后者可结合 BM25/关键词) - [[混合搜索]] ← 扩展(向量检索 + BM25 关键词检索融合排序) ## Advantage over Keyword Search | 维度 | 关键词搜索 | 向量检索 | |------|----------|---------| | 匹配方式 | 字面匹配 | 语义相似度 | | 同义词处理 | 无法识别 | 天然处理 | | 歧义词处理 | 精确但机械 | 需依赖高质量 Embedding | | 适用场景 | 精确查询 | 语义模糊查询 |