45 lines
2.2 KiB
Markdown
45 lines
2.2 KiB
Markdown
---
|
||
title: "Semantic Memory Search"
|
||
type: source
|
||
tags: []
|
||
date: 2026-04-27
|
||
---
|
||
|
||
## Source File
|
||
- [[raw/Agent/usecases/semantic-memory-search.md]]
|
||
|
||
## Summary(用中文描述)
|
||
- 核心主题:为 OpenClaw 的 markdown 记忆文件添加向量语义搜索能力
|
||
- 问题域:随着记忆文件增多,无法通过关键词查找语义相关内容
|
||
- 方法/机制:使用 memsearch 工具,将 markdown 文件索引到 Milvus 向量数据库,结合语义搜索 + BM25 全文搜索 + RRF 重排
|
||
- 结论/价值:实现按语义而非关键词搜索记忆,支持文件监控自动重索引,节省 API 调用的智能去重
|
||
|
||
## Key Claims(用中文描述)
|
||
- memsearch 通过 SHA-256 内容哈希实现增量索引,未变化的文件不会被重新嵌入,零 API 浪费
|
||
- 混合搜索(稠密向量 + BM25)通过倒数排名融合(RRF)重排,优于纯向量搜索
|
||
- Markdown 文件始终是数据源,向量索引只是可重建的派生缓存
|
||
|
||
## Key Quotes
|
||
> "There is no search, just scrolling through files." — 描述 OpenClaw 记忆系统的原始痛点
|
||
> "Markdown stays the source of truth. The vector index is just a derived cache — you can rebuild it anytime with `memsearch index`." — 强调数据主权设计
|
||
|
||
## Key Concepts
|
||
- [[HybridSearch]]:结合语义相似度(稠密向量)与关键词匹配(BM25)的混合搜索方法
|
||
- [[Incremental-Indexing]]:基于内容哈希的增量索引,只处理新增或变化的文件块
|
||
- [[Reciprocal-Rank-Fusion]]:倒数排名融合,通过综合多个搜索结果排名生成最终排序
|
||
- [[Vector-Embedding]]:向量嵌入技术,将文本编码为高维向量用于语义搜索
|
||
|
||
## Key Entities
|
||
- [[OpenClaw]]:开源的 AI Agent 记忆系统,将所有记忆存储为 markdown 文件
|
||
- [[memsearch]]:基于 Milvus 的向量搜索 CLI/库,为 markdown 文件提供语义搜索能力
|
||
- [[Milvus]]:开源向量数据库,为语义搜索提供底层存储和检索支持
|
||
|
||
## Connections
|
||
- [[memsearch]] ← built_on ← [[Milvus]]
|
||
- [[memsearch]] ← enhances ← [[OpenClaw]]
|
||
- [[semantic-memory-search]] ← related_to ← [[SecondBrain]]
|
||
- [[semantic-memory-search]] ← similar_pain_point ← [[knowledge-base-rag]]
|
||
|
||
## Contradictions
|
||
- 无已知冲突
|