1.4 KiB
1.4 KiB
title, type, last_updated
| title | type | last_updated |
|---|---|---|
| Semantic Search | concept | 2026-04-22 |
Definition
基于 Embedding 向量模型将文本编码为高维向量,通过向量相似度(如余弦相似度)而非关键词匹配来检索相关内容的搜索方式。相比 BM25/BM25 等传统关键词检索,能捕捉语义层面的相关性,例如"我保存的关于 LLM memory 的内容?"能匹配到讨论 agent 记忆机制的文章,即使两者用词不同。
How It Works
用户查询 → Embedding 模型编码 → 高维向量
文档库 → Embedding 模型编码 → 文档向量集合
↓
向量相似度计算(ANN 索引)→ Top-K 结果 → LLM 回答
Components
| 组件 | 说明 |
|---|---|
| Embedding 模型 | text-embedding-3-small、BGE、Sentence-BERT 等 |
| ANN 索引 | FAISS / HNSW / ScaNN,实现十亿级向量近实时检索 |
| 相似度度量 | 余弦相似度 / 点积 / 欧氏距离 |
Why It Matters in RAG
关键词搜索依赖字面匹配,容易漏掉同义词/多义词场景。语义搜索理解查询意图,使 Knowledge-Base-RAG 返回真正相关结果而非机械的字面匹配。
Connections
- Knowledge-Base-RAG — 语义搜索是知识库 RAG 的检索层
- Vector-Embedding — 语义搜索的底层编码技术
- Hybrid Search — 向量检索 + BM25 关键词检索融合,进一步提升召回率