Files
nexus/wiki/concepts/Retrieval.md

50 lines
1.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "Retrieval"
type: concept
tags: [RAG, 向量检索, 语义搜索]
sources: [rag从入门到精通系列1-基础rag]
last_updated: 2025-01-16
---
## Definition
Retrieval检索阶段是 RAG 管道的第二阶段根据用户问题的语义向量Embedding Vector在向量数据库中检索与之最相似的 Top-k 个文档块。
## Core Process
```
用户问题 → 问题向量化 → Vector Store 相似度检索 → 返回 Top-k 文档块
```
1. **问题向量化**:将用户输入的自然语言问题通过相同的 Embedding Model 转换为向量
2. **相似度计算**Vector Store 计算问题向量与所有文档块向量的相似度(常用方法:余弦相似度、点积、欧氏距离)
3. **返回 Top-k 结果**:返回相似度最高的 k 个文档块作为检索结果
## Similarity Metrics
| 方法 | 适用场景 |
|------|----------|
| 余弦相似度Cosine | 归一化向量,衡量方向相似性 |
| 点积Dot Product | 未归一化向量,兼顾 magnitude |
| 欧氏距离L2 | 几何距离,适用低维空间 |
## Retrieval Strategies
- **Top-k Retrieval**:返回相似度最高的 k 个结果
- **MMRMaximal Marginal Relevance**:平衡相关性和多样性,减少重复信息
- **Hybrid Retrieval**结合关键词检索BM25与向量检索
## Connections
- [[Retrieval]] ← part_of ← [[RAG]]
- [[Retrieval]] ← uses ← [[Vector-Store]]
- [[Retrieval]] ← uses ← [[Embedding]]
- [[Retrieval]] ← feeds_into ← [[Generation]]
## Aliases
- Information Retrieval
- Semantic Search
- 向量检索
- 语义检索