title, type, tags, sources, last_updated
| title |
type |
tags |
sources |
last_updated |
| Retrieval |
concept |
|
|
2025-01-16 |
Definition
Retrieval(检索阶段)是 RAG 管道的第二阶段,根据用户问题的语义向量(Embedding Vector)在向量数据库中检索与之最相似的 Top-k 个文档块。
Core Process
- 问题向量化:将用户输入的自然语言问题通过相同的 Embedding Model 转换为向量
- 相似度计算:Vector Store 计算问题向量与所有文档块向量的相似度(常用方法:余弦相似度、点积、欧氏距离)
- 返回 Top-k 结果:返回相似度最高的 k 个文档块作为检索结果
Similarity Metrics
| 方法 |
适用场景 |
| 余弦相似度(Cosine) |
归一化向量,衡量方向相似性 |
| 点积(Dot Product) |
未归一化向量,兼顾 magnitude |
| 欧氏距离(L2) |
几何距离,适用低维空间 |
Retrieval Strategies
- Top-k Retrieval:返回相似度最高的 k 个结果
- MMR(Maximal Marginal Relevance):平衡相关性和多样性,减少重复信息
- Hybrid Retrieval:结合关键词检索(BM25)与向量检索
Connections
Aliases
- Information Retrieval
- Semantic Search
- 向量检索
- 语义检索