nexus/wiki/concepts/Semantic-Search.md at 480d64ae81f09545cb7c7d04e2b64e5d9fa4f372

Files

weishen e823c78a9b Auto-sync: 2026-04-23 00:02

2026-04-23 00:02:55 +08:00

1.4 KiB

Raw Blame History

title, type, last_updated

title	type	last_updated
Semantic Search	concept	2026-04-22

Definition

基于 Embedding 向量模型将文本编码为高维向量，通过向量相似度（如余弦相似度）而非关键词匹配来检索相关内容的搜索方式。相比 BM25/BM25 等传统关键词检索，能捕捉语义层面的相关性，例如"我保存的关于 LLM memory 的内容？"能匹配到讨论 agent 记忆机制的文章，即使两者用词不同。

How It Works

用户查询 → Embedding 模型编码 → 高维向量
文档库 → Embedding 模型编码 → 文档向量集合
↓
向量相似度计算（ANN 索引）→ Top-K 结果 → LLM 回答

Components

组件	说明
Embedding 模型	text-embedding-3-small、BGE、Sentence-BERT 等
ANN 索引	FAISS / HNSW / ScaNN，实现十亿级向量近实时检索
相似度度量	余弦相似度 / 点积 / 欧氏距离

Why It Matters in RAG

关键词搜索依赖字面匹配，容易漏掉同义词/多义词场景。语义搜索理解查询意图，使 Knowledge-Base-RAG 返回真正相关结果而非机械的字面匹配。

Connections

Knowledge-Base-RAG — 语义搜索是知识库 RAG 的检索层
Vector-Embedding — 语义搜索的底层编码技术
Hybrid Search — 向量检索 + BM25 关键词检索融合，进一步提升召回率

1.4 KiB Raw Blame History Unescape Escape