--- title: "RAG从入门到精通系列1:基础RAG" type: source tags: [rag, LLM, retrieval, vector-database] date: 2025-12-18 --- ## Source File - [[raw/AI/RAG从入门到精通系列1:基础RAG.md]] ## Summary - 核心主题:RAG基础概念和实现流程 - 问题域:LLM缺乏最新和私有数据 - 方法/机制:索引→检索→生成的三步流程 - 结论/价值:RAG是连接LLM与外部数据源的通用方法 ## Key Claims - RAG = Retrieval Augmented Generation,检索增强生成 - Indexing:将文档切分并转换为Embedding向量存入向量数据库 - Retrieval:根据问题语义向量检索相关文档块 - Generation:将问题和相关文档输入LLM生成答案 - Embedding Model的Context Window有限(512-8192 token),需切分文档 ## Key Concepts - [[RAG]]:检索增强生成 - [[Embedding]]:将文本转换为数值向量的技术 - [[向量数据库]]:存储和检索向量表示的数据库 - [[文档切分]]:将长文档分割成符合Embedding窗口的块 - [[Context Window]]:模型能接受的上下文长度限制 ## Key Entities - [[LangChain]]:RAG实现框架 - [[Qdrant]]:向量数据库 - [[BAAI]]:Embedding模型提供商 ## Connections - [[LLM]] ← uses ← [[RAG]] - [[RAG]] ← includes ← [[索引]] - [[RAG]] ← includes ← [[检索]] - [[RAG]] ← includes ← [[生成]] ## Contradictions