Auto-sync

2026-04-15 15:02:52 +08:00
parent bb2f9b2b3a
commit d3e7fcf81f
71 changed files with 2549 additions and 0 deletions
--- a/wiki/sources/RAG从入门到精通系列1：基础RAG.md
+++ b/wiki/sources/RAG从入门到精通系列1：基础RAG.md
@@ -0,0 +1,49 @@
+---
+title: "RAG从入门到精通系列1：基础RAG"
+type: source
+tags: [rag, llm, retrieval-augmented-generation, 向量数据库]
+sources: ["https://mp.weixin.qq.com/s/TlFNOw7_3Q8qywKLpVUmfg"]
+last_updated: 2026-04-15
+---
+
+## Source File
+- [[raw/AI/RAG从入门到精通系列1：基础RAG.md]]
+
+## Summary
+- 核心主题：基础 RAG（检索增强生成）的技术原理与工程实践
+- 问题域：如何让 LLM 使用外部私有数据或最新数据
+- 方法/机制：Indexing（文档加载→切分→向量化→存入向量库）→ Retrieval（问题向量化→相似度检索）→ Generation（问题+知识片段→PromptTemplate→LLM生成）
+- 结论/价值：RAG 是连接 LLM 与外部数据源的通用方法，LangChain/LlamaIndex 等框架可简化管道构建
+
+## Key Claims
+- LLM 本身不具备特定任务相关的私有数据或最新数据
+- RAG 通过 Indexing-Retrieval-Generation 三阶段将外部数据连接到 LLM
+- Embedding Model 的 Context Window 有限（512~8192 token），需将文档切分成 Split
+- Vector Store 实现各种 Embedding Vector 相似度比较方法
+- LangChain/LlamaIndex 框架可简化检索与生成链路的串联
+
+## Key Concepts
+- [[RAG]]：检索增强生成，连接 LLM 与外部数据源的方法
+- [[Embedding]]：将文本转为固定长度数值向量，捕获语义信息
+- [[向量数据库]]：存储 Embedding Vector，实现相似度检索
+- [[Indexing]]：文档加载、文本切分、向量化、存入向量库的过程
+- [[Retrieval]]：根据问题语义向量检索相似知识片段
+- [[Generation]]：将问题+知识片段输入 LLM 生成答案
+- [[LangChain]]：LLM 应用开发框架，支持 RAG 管道构建
+- [[Token]]：模型处理文本的基本单位，英文3-4字母/中文1汉字 ≈ 1 token
+- [[Context Window]]：Embedding Model 能接受的最大 token 数，通常512~8192
+- [[Split/文档块]]：切分后的文档片段，满足 Embedding Model 长度限制
+
+## Key Entities
+- [[LangChain]]：LLM 应用开发框架
+- [[Qdrant]]：Rust 编写的开源向量数据库
+- [[BAAI]]：开源 Embedding Model 提供方（如 BGE 系列）
+
+## Connections
+- [[RAG]] ← 核心概念 ← [[LLM]]
+- [[Embedding]] ← 核心技术 ← [[RAG]]
+- [[向量数据库]] ← 存储层 ← [[RAG]]
+- [[Indexing]] ← 第一阶段 ← [[RAG]]
+- [[Retrieval]] ← 第二阶段 ← [[RAG]]
+- [[Generation]] ← 第三阶段 ← [[RAG]]
+- [[LLM]] ← 生成层 ← [[RAG]]