Files
nexus/wiki/concepts/混合搜索.md
2026-04-23 04:02:48 +08:00

1.3 KiB
Raw Blame History

title, type, tags, sources, last_updated
title type tags sources last_updated
混合搜索 concept
ai
search
vector
bm25
rag
google-神级生产力工具-所有-github-开源平替都找到了
2026-04-23

Definition

混合搜索Hybrid Search结合语义搜索向量相似度和全文搜索BM25/关键词匹配两种技术并通过重排序算法Re-ranking整合结果兼顾语义理解深度和关键词精确度。

Why Hybrid?

  • 语义搜索擅长:理解意图、同义词扩展、语义相关但不含关键词的内容
  • BM25 擅长:精确关键词匹配、人名/产品名/技术术语、查询词密集出现的内容
  • 两者结合:互相补充,提升整体召回率和精确率

Technical Pipeline (SurfSense 方案)

  1. 语义搜索:向量相似度初筛,获取语义相关候选集
  2. BM25 全文搜索:关键词精确匹配,补充专有名词召回
  3. 融合排序:使用 RRFReciprocal Rank Fusion等算法合并两个结果集
  4. 重排序Re-ranking:使用更精准的模型对 top 结果二次排序
  • 语义搜索 — 混合搜索的一个组成维度
  • 重排序Re-ranking— 对混合结果集进行精排
  • RAG — 混合搜索常作为 RAG 系统的检索层