title, type, tags, sources, last_updated
| title |
type |
tags |
sources |
last_updated |
| 混合搜索 |
concept |
| ai |
| search |
| vector |
| bm25 |
| rag |
|
| google-神级生产力工具-所有-github-开源平替都找到了 |
|
2026-04-23 |
Definition
混合搜索(Hybrid Search)结合语义搜索(向量相似度)和全文搜索(BM25/关键词匹配)两种技术,并通过重排序算法(Re-ranking)整合结果,兼顾语义理解深度和关键词精确度。
Why Hybrid?
- 语义搜索擅长:理解意图、同义词扩展、语义相关但不含关键词的内容
- BM25 擅长:精确关键词匹配、人名/产品名/技术术语、查询词密集出现的内容
- 两者结合:互相补充,提升整体召回率和精确率
Technical Pipeline (SurfSense 方案)
- 语义搜索:向量相似度初筛,获取语义相关候选集
- BM25 全文搜索:关键词精确匹配,补充专有名词召回
- 融合排序:使用 RRF(Reciprocal Rank Fusion)等算法合并两个结果集
- 重排序(Re-ranking):使用更精准的模型对 top 结果二次排序
Related Concepts
- 语义搜索 — 混合搜索的一个组成维度
- 重排序(Re-ranking)— 对混合结果集进行精排
- RAG — 混合搜索常作为 RAG 系统的检索层