Files
nexus/wiki/sources/semantic-memory-search.md

45 lines
2.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "Semantic Memory Search"
type: source
tags: []
date: 2026-04-27
---
## Source File
- [[raw/Agent/usecases/semantic-memory-search.md]]
## Summary用中文描述
- 核心主题:为 OpenClaw 的 markdown 记忆文件添加向量语义搜索能力
- 问题域:随着记忆文件增多,无法通过关键词查找语义相关内容
- 方法/机制:使用 memsearch 工具,将 markdown 文件索引到 Milvus 向量数据库,结合语义搜索 + BM25 全文搜索 + RRF 重排
- 结论/价值:实现按语义而非关键词搜索记忆,支持文件监控自动重索引,节省 API 调用的智能去重
## Key Claims用中文描述
- memsearch 通过 SHA-256 内容哈希实现增量索引,未变化的文件不会被重新嵌入,零 API 浪费
- 混合搜索(稠密向量 + BM25通过倒数排名融合RRF重排优于纯向量搜索
- Markdown 文件始终是数据源,向量索引只是可重建的派生缓存
## Key Quotes
> "There is no search, just scrolling through files." — 描述 OpenClaw 记忆系统的原始痛点
> "Markdown stays the source of truth. The vector index is just a derived cache — you can rebuild it anytime with `memsearch index`." — 强调数据主权设计
## Key Concepts
- [[HybridSearch]]结合语义相似度稠密向量与关键词匹配BM25的混合搜索方法
- [[Incremental-Indexing]]:基于内容哈希的增量索引,只处理新增或变化的文件块
- [[Reciprocal-Rank-Fusion]]:倒数排名融合,通过综合多个搜索结果排名生成最终排序
- [[Vector-Embedding]]:向量嵌入技术,将文本编码为高维向量用于语义搜索
## Key Entities
- [[OpenClaw]]:开源的 AI Agent 记忆系统,将所有记忆存储为 markdown 文件
- [[memsearch]]:基于 Milvus 的向量搜索 CLI/库,为 markdown 文件提供语义搜索能力
- [[Milvus]]:开源向量数据库,为语义搜索提供底层存储和检索支持
## Connections
- [[memsearch]] ← built_on ← [[Milvus]]
- [[memsearch]] ← enhances ← [[OpenClaw]]
- [[semantic-memory-search]] ← related_to ← [[SecondBrain]]
- [[semantic-memory-search]] ← similar_pain_point ← [[knowledge-base-rag]]
## Contradictions
- 无已知冲突