Auto-sync: 2026-04-16 13:01

This commit is contained in:
2026-04-16 13:01:38 +08:00
parent c0571d778c
commit b2250c60b2
59 changed files with 1288 additions and 2670 deletions

View File

@@ -0,0 +1,36 @@
---
id: vector-search
title: 向量检索
type: concept
tags: [信息检索, 向量数据库]
sources: ["RAG从入门到精通系列1基础RAG.md"]
last_updated: 2026-04-16
---
## Definition
向量检索Vector Search / Similarity Search是根据语义相似度在向量数据库中检索相关文档的技术核心是比较查询向量与文档向量的"距离"(余弦相似度),而非字面匹配。
## Mechanism
1. Query 通过 [[Embedding]] 模型转为固定长度向量
2. 在 [[向量数据库]](如 [[Qdrant]])中按余弦相似度检索 Top-K 最接近的向量
3. 返回对应的文档块作为 [[RAG]] 的 Context
## Key Parameters
- **Top-K**:返回最相似的 K 个结果K=3~10 常见)
- **相似度阈值**:过滤低于某分数的结果
- **Reranking**:初筛后用更大模型重新排序(如 BGE-Reranker
## Connections
- [[RAG]] ← 核心阶段Retrieval 阶段的具体技术)
- [[Qdrant]] ← 存储层
- [[Embedding]] ← 依赖Query 和文档均需向量化)
- [[语义搜索]] ← 同类技术(前者基于向量,后者可结合 BM25/关键词)
- [[混合搜索]] ← 扩展(向量检索 + BM25 关键词检索融合排序)
## Advantage over Keyword Search
| 维度 | 关键词搜索 | 向量检索 |
|------|----------|---------|
| 匹配方式 | 字面匹配 | 语义相似度 |
| 同义词处理 | 无法识别 | 天然处理 |
| 歧义词处理 | 精确但机械 | 需依赖高质量 Embedding |
| 适用场景 | 精确查询 | 语义模糊查询 |