Auto-sync: 2026-04-16 13:01
This commit is contained in:
36
wiki/concepts/向量检索.md
Normal file
36
wiki/concepts/向量检索.md
Normal file
@@ -0,0 +1,36 @@
|
||||
---
|
||||
id: vector-search
|
||||
title: 向量检索
|
||||
type: concept
|
||||
tags: [信息检索, 向量数据库]
|
||||
sources: ["RAG从入门到精通系列1:基础RAG.md"]
|
||||
last_updated: 2026-04-16
|
||||
---
|
||||
|
||||
## Definition
|
||||
向量检索(Vector Search / Similarity Search)是根据语义相似度在向量数据库中检索相关文档的技术,核心是比较查询向量与文档向量的"距离"(余弦相似度),而非字面匹配。
|
||||
|
||||
## Mechanism
|
||||
1. Query 通过 [[Embedding]] 模型转为固定长度向量
|
||||
2. 在 [[向量数据库]](如 [[Qdrant]])中按余弦相似度检索 Top-K 最接近的向量
|
||||
3. 返回对应的文档块作为 [[RAG]] 的 Context
|
||||
|
||||
## Key Parameters
|
||||
- **Top-K**:返回最相似的 K 个结果(K=3~10 常见)
|
||||
- **相似度阈值**:过滤低于某分数的结果
|
||||
- **Reranking**:初筛后用更大模型重新排序(如 BGE-Reranker)
|
||||
|
||||
## Connections
|
||||
- [[RAG]] ← 核心阶段(Retrieval 阶段的具体技术)
|
||||
- [[Qdrant]] ← 存储层
|
||||
- [[Embedding]] ← 依赖(Query 和文档均需向量化)
|
||||
- [[语义搜索]] ← 同类技术(前者基于向量,后者可结合 BM25/关键词)
|
||||
- [[混合搜索]] ← 扩展(向量检索 + BM25 关键词检索融合排序)
|
||||
|
||||
## Advantage over Keyword Search
|
||||
| 维度 | 关键词搜索 | 向量检索 |
|
||||
|------|----------|---------|
|
||||
| 匹配方式 | 字面匹配 | 语义相似度 |
|
||||
| 同义词处理 | 无法识别 | 天然处理 |
|
||||
| 歧义词处理 | 精确但机械 | 需依赖高质量 Embedding |
|
||||
| 适用场景 | 精确查询 | 语义模糊查询 |
|
||||
Reference in New Issue
Block a user