Files
nexus/wiki/sources/knowledge-base-rag.md

43 lines
2.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "Personal Knowledge Base (RAG)"
type: source
tags: []
date: 2026-04-27
---
## Source File
- [[raw/Agent/usecases/knowledge-base-rag.md]]
## Summary用中文描述
- 核心主题:构建可搜索的个人知识库,从所有保存的内容(文章/Tweet/YouTube 视频/PDF中自动摄取并支持语义检索
- 问题域:阅读了大量文章、视频和 Tweet却永远找不到上周看到的那条内容书签堆积变得毫无用处
- 方法/机制:通过 Telegram Topic 或 Slack Channel 接收 URL → 自动抓取内容(文章/Tweet/YouTube 字幕/PDF→ 语义索引入库 → 支持自然语言提问检索 → 可供其他工作流(如视频创意流水线)查询
- 结论/价值:**捕获像发短信一样简单,检索像搜索一样简单**;零摩擦摄入 + 语义搜索是解决"知识黑洞"的核心
## Key Claims用中文描述
- Telegram Topic 或 Slack Channel 可作为个人知识库的零摩擦摄入入口,用户直接发 URL 即可
- 语义搜索Semantic Search使"我存了什么关于 LLM 记忆的内容?"这类自然语言查询成为可能,返回带来源和摘要的排序结果
- 知识库可作为其他 AI 工作流的检索后端——如视频创意流水线在构建研究卡片时自动查询相关已存内容
## Key Quotes
> "You read articles, tweets, and watch videos all day but can never find that one thing you saw last week. Bookmarks pile up and become useless." — 痛点描述
## Key Concepts
- [[Semantic Search]]:基于语义向量相似度的搜索,而非关键词匹配,实现自然语言查询已存内容
- [[RAG]]Retrieval-Augmented Generation将外部知识库检索与 LLM 生成结合,提升回答的上下文相关性
- [[Knowledge Base]]:集中存储、结构化索引、可按需检索的个人或组织知识集合
## Key Entities
- [[OpenClaw]]AI Agent 框架,驱动整个 KB 摄取和检索流程fetch 内容 → 索引 → 查询响应)
- [[Telegram]]:作为摄取入口的即时通讯平台,用户发 URL 到专属 Topic 触发自动摄入
- [[Slack]]Telegram 的替代摄取入口,通过 Channel 实现相同功能
## Connections
- [[Second Brain]] ← 理念同源 ← [[Personal Knowledge Base (RAG)]]
- [[养虾日记3]] ← 受启发于 ← [[Personal Knowledge Base (RAG)]]
- [[custom-morning-brief]] ← 可查询 ← [[Personal Knowledge Base (RAG)]]
- [[semantic-memory-search]] ← 技术基础 ← [[Personal Knowledge Base (RAG)]]
## Contradictions
- 与 [[Second Brain]] 的摄入方式:[[Second Brain]] 侧重对话内捕获(发短信"Remind me..."[[Personal Knowledge Base (RAG)]] 侧重 URL 链接的直接摄入——两者摄入路径不同,可互补而非冲突