Files
nexus/wiki/concepts/Retrieval.md

1.6 KiB
Raw Blame History

title, type, tags, sources, last_updated
title type tags sources last_updated
Retrieval concept
RAG
向量检索
语义搜索
rag从入门到精通系列1-基础rag
2025-01-16

Definition

Retrieval检索阶段是 RAG 管道的第二阶段根据用户问题的语义向量Embedding Vector在向量数据库中检索与之最相似的 Top-k 个文档块。

Core Process

用户问题 → 问题向量化 → Vector Store 相似度检索 → 返回 Top-k 文档块
  1. 问题向量化:将用户输入的自然语言问题通过相同的 Embedding Model 转换为向量
  2. 相似度计算Vector Store 计算问题向量与所有文档块向量的相似度(常用方法:余弦相似度、点积、欧氏距离)
  3. 返回 Top-k 结果:返回相似度最高的 k 个文档块作为检索结果

Similarity Metrics

方法 适用场景
余弦相似度Cosine 归一化向量,衡量方向相似性
点积Dot Product 未归一化向量,兼顾 magnitude
欧氏距离L2 几何距离,适用低维空间

Retrieval Strategies

  • Top-k Retrieval:返回相似度最高的 k 个结果
  • MMRMaximal Marginal Relevance:平衡相关性和多样性,减少重复信息
  • Hybrid Retrieval结合关键词检索BM25与向量检索

Connections

Aliases

  • Information Retrieval
  • Semantic Search
  • 向量检索
  • 语义检索