Auto-sync: 2026-04-16 13:01

2026-04-16 13:01:38 +08:00
parent c0571d778c
commit b2250c60b2
59 changed files with 1288 additions and 2670 deletions
--- a/wiki/concepts/向量检索.md
+++ b/wiki/concepts/向量检索.md
@@ -0,0 +1,36 @@
+---
+id: vector-search
+title: 向量检索
+type: concept
+tags: [信息检索, 向量数据库]
+sources: ["RAG从入门到精通系列1：基础RAG.md"]
+last_updated: 2026-04-16
+---
+
+## Definition
+向量检索（Vector Search / Similarity Search）是根据语义相似度在向量数据库中检索相关文档的技术，核心是比较查询向量与文档向量的"距离"（余弦相似度），而非字面匹配。
+
+## Mechanism
+1. Query 通过 [[Embedding]] 模型转为固定长度向量
+2. 在 [[向量数据库]]（如 [[Qdrant]]）中按余弦相似度检索 Top-K 最接近的向量
+3. 返回对应的文档块作为 [[RAG]] 的 Context
+
+## Key Parameters
+- **Top-K**：返回最相似的 K 个结果（K=3~10 常见）
+- **相似度阈值**：过滤低于某分数的结果
+- **Reranking**：初筛后用更大模型重新排序（如 BGE-Reranker）
+
+## Connections
+- [[RAG]] ← 核心阶段（Retrieval 阶段的具体技术）
+- [[Qdrant]] ← 存储层
+- [[Embedding]] ← 依赖（Query 和文档均需向量化）
+- [[语义搜索]] ← 同类技术（前者基于向量，后者可结合 BM25/关键词）
+- [[混合搜索]] ← 扩展（向量检索 + BM25 关键词检索融合排序）
+
+## Advantage over Keyword Search
+| 维度 | 关键词搜索 | 向量检索 |
+|------|----------|---------|
+| 匹配方式 | 字面匹配 | 语义相似度 |
+| 同义词处理 | 无法识别 | 天然处理 |
+| 歧义词处理 | 精确但机械 | 需依赖高质量 Embedding |
+| 适用场景 | 精确查询 | 语义模糊查询 |