Auto-sync: 2026-04-23 04:02

This commit is contained in:
2026-04-23 04:02:48 +08:00
parent d1e7e4344b
commit 6f44ff76a2
64 changed files with 3300 additions and 1129 deletions

View File

@@ -0,0 +1,26 @@
---
title: "混合搜索"
type: concept
tags: [ai, search, vector, bm25, rag]
sources: [google-神级生产力工具-所有-github-开源平替都找到了]
last_updated: 2026-04-23
---
## Definition
混合搜索Hybrid Search结合语义搜索向量相似度和全文搜索BM25/关键词匹配两种技术并通过重排序算法Re-ranking整合结果兼顾语义理解深度和关键词精确度。
## Why Hybrid?
- **语义搜索擅长**:理解意图、同义词扩展、语义相关但不含关键词的内容
- **BM25 擅长**:精确关键词匹配、人名/产品名/技术术语、查询词密集出现的内容
- **两者结合**:互相补充,提升整体召回率和精确率
## Technical Pipeline (SurfSense 方案)
1. **语义搜索**:向量相似度初筛,获取语义相关候选集
2. **BM25 全文搜索**:关键词精确匹配,补充专有名词召回
3. **融合排序**:使用 RRFReciprocal Rank Fusion等算法合并两个结果集
4. **重排序Re-ranking**:使用更精准的模型对 top 结果二次排序
## Related Concepts
- [[语义搜索]] — 混合搜索的一个组成维度
- [[重排序]]Re-ranking— 对混合结果集进行精排
- [[RAG]] — 混合搜索常作为 RAG 系统的检索层