Auto-sync: 2026-04-23 04:02
This commit is contained in:
26
wiki/concepts/混合搜索.md
Normal file
26
wiki/concepts/混合搜索.md
Normal file
@@ -0,0 +1,26 @@
|
||||
---
|
||||
title: "混合搜索"
|
||||
type: concept
|
||||
tags: [ai, search, vector, bm25, rag]
|
||||
sources: [google-神级生产力工具-所有-github-开源平替都找到了]
|
||||
last_updated: 2026-04-23
|
||||
---
|
||||
|
||||
## Definition
|
||||
混合搜索(Hybrid Search)结合语义搜索(向量相似度)和全文搜索(BM25/关键词匹配)两种技术,并通过重排序算法(Re-ranking)整合结果,兼顾语义理解深度和关键词精确度。
|
||||
|
||||
## Why Hybrid?
|
||||
- **语义搜索擅长**:理解意图、同义词扩展、语义相关但不含关键词的内容
|
||||
- **BM25 擅长**:精确关键词匹配、人名/产品名/技术术语、查询词密集出现的内容
|
||||
- **两者结合**:互相补充,提升整体召回率和精确率
|
||||
|
||||
## Technical Pipeline (SurfSense 方案)
|
||||
1. **语义搜索**:向量相似度初筛,获取语义相关候选集
|
||||
2. **BM25 全文搜索**:关键词精确匹配,补充专有名词召回
|
||||
3. **融合排序**:使用 RRF(Reciprocal Rank Fusion)等算法合并两个结果集
|
||||
4. **重排序(Re-ranking)**:使用更精准的模型对 top 结果二次排序
|
||||
|
||||
## Related Concepts
|
||||
- [[语义搜索]] — 混合搜索的一个组成维度
|
||||
- [[重排序]](Re-ranking)— 对混合结果集进行精排
|
||||
- [[RAG]] — 混合搜索常作为 RAG 系统的检索层
|
||||
Reference in New Issue
Block a user