---
title: "RAG从入门到精通系列1：基础RAG"
type: source
tags: [RAG, LLM, 检索增强生成, 向量数据库]
sources: ["https://mp.weixin.qq.com/s/TlFNOw7_3Q8qywKLpVUmfg"]
date: 2025-12-18
---

## Summary
- 核心主题：RAG基础概念与实现流程
- 问题域：如何将LLM与外部数据源连接
- 方法/机制：Indexing → Retrieval → Generation三阶段流程
- 结论/价值：RAG是连接LLM与外部私有/最新数据的通用方法

## Key Claims
- RAG = Retrieval Augmented Generation，将LLM与外部数据源连接
- 三阶段：Indexing（文档索引）、Retrieval（检索）、Generation（生成）
- Embedding Model将文本转为固定长度向量，受Context Window限制
- 向量数据库（Qdrant等）存储Embedding Vector并实现相似度检索
- LangChain/LlamaIndex等框架简化RAG流程

## Key Concepts
- [[RAG]]（检索增强生成）：将LLM与外部数据源连接的通用方法
- [[Indexing]]：将外部文档切分并建立索引的过程
- [[Retrieval]]：根据问题语义向量检索相关文档
- [[Generation]]：将问题+知识片段输入LLM生成答案
- [[Embedding Vector]]：文本的数值表示，捕获语义信息
- [[Vector Store]]：存储Embedding Vector并实现相似度检索的数据库
- [[Context Window]]：Embedding Model能接受的最大token数

## Connections
- [[RAG]] ← 包含 ← [[Indexing]]
- [[RAG]] ← 包含 ← [[Retrieval]]
- [[RAG]] ← 包含 ← [[Generation]]
- [[LLM]] ← 扩展 ← [[RAG]]

## Contradictions
- 与[[LLM Wiki]]冲突：
  - 冲突点：知识获取方式
  - 当前观点：RAG从外部检索获取最新/私有数据
  - [[LLM Wiki]]观点：增量累积知识到内部记忆