--- title: "RAG从入门到精通系列1:基础RAG" type: source tags: [RAG, LLM, 检索增强生成, 向量数据库] sources: ["https://mp.weixin.qq.com/s/TlFNOw7_3Q8qywKLpVUmfg"] date: 2025-12-18 --- ## Summary - 核心主题:RAG基础概念与实现流程 - 问题域:如何将LLM与外部数据源连接 - 方法/机制:Indexing → Retrieval → Generation三阶段流程 - 结论/价值:RAG是连接LLM与外部私有/最新数据的通用方法 ## Key Claims - RAG = Retrieval Augmented Generation,将LLM与外部数据源连接 - 三阶段:Indexing(文档索引)、Retrieval(检索)、Generation(生成) - Embedding Model将文本转为固定长度向量,受Context Window限制 - 向量数据库(Qdrant等)存储Embedding Vector并实现相似度检索 - LangChain/LlamaIndex等框架简化RAG流程 ## Key Concepts - [[RAG]](检索增强生成):将LLM与外部数据源连接的通用方法 - [[Indexing]]:将外部文档切分并建立索引的过程 - [[Retrieval]]:根据问题语义向量检索相关文档 - [[Generation]]:将问题+知识片段输入LLM生成答案 - [[Embedding Vector]]:文本的数值表示,捕获语义信息 - [[Vector Store]]:存储Embedding Vector并实现相似度检索的数据库 - [[Context Window]]:Embedding Model能接受的最大token数 ## Connections - [[RAG]] ← 包含 ← [[Indexing]] - [[RAG]] ← 包含 ← [[Retrieval]] - [[RAG]] ← 包含 ← [[Generation]] - [[LLM]] ← 扩展 ← [[RAG]] ## Contradictions - 与[[LLM Wiki]]冲突: - 冲突点:知识获取方式 - 当前观点:RAG从外部检索获取最新/私有数据 - [[LLM Wiki]]观点:增量累积知识到内部记忆