Files
nexus/wiki/concepts/向量检索.md
2026-04-16 13:01:42 +08:00

1.5 KiB
Raw Blame History

id, title, type, tags, sources, last_updated
id title type tags sources last_updated
vector-search 向量检索 concept
信息检索
向量数据库
RAG从入门到精通系列1基础RAG.md
2026-04-16

Definition

向量检索Vector Search / Similarity Search是根据语义相似度在向量数据库中检索相关文档的技术核心是比较查询向量与文档向量的"距离"(余弦相似度),而非字面匹配。

Mechanism

  1. Query 通过 Embedding 模型转为固定长度向量
  2. 向量数据库(如 Qdrant)中按余弦相似度检索 Top-K 最接近的向量
  3. 返回对应的文档块作为 RAG 的 Context

Key Parameters

  • Top-K:返回最相似的 K 个结果K=3~10 常见)
  • 相似度阈值:过滤低于某分数的结果
  • Reranking:初筛后用更大模型重新排序(如 BGE-Reranker

Connections

  • RAG ← 核心阶段Retrieval 阶段的具体技术)
  • Qdrant ← 存储层
  • Embedding ← 依赖Query 和文档均需向量化)
  • 语义搜索 ← 同类技术(前者基于向量,后者可结合 BM25/关键词)
  • 混合搜索 ← 扩展(向量检索 + BM25 关键词检索融合排序)
维度 关键词搜索 向量检索
匹配方式 字面匹配 语义相似度
同义词处理 无法识别 天然处理
歧义词处理 精确但机械 需依赖高质量 Embedding
适用场景 精确查询 语义模糊查询