nexus/wiki/sources/RAG从入门到精通系列1基础RAG.md

---
title: "RAG 从入门到精通系列1：基础 RAG 完全指南"
type: source
tags: ['RAG', 'LLM', '检索增强生成', 'Embedding', '向量数据库', 'LangChain', '教程']
date: 2025-01-16
source: https://mp.weixin.qq.com/s/
author: 南七无名式
---

## Source File
- [[raw/AI/RAG从入门到精通系列1：基础RAG.md]]

## Summary
- 核心主题：RAG（检索增强生成）基础概念与三步流程（Indexing→Retrieval→Generation）详解
- 问题域：LLM 知识有截止日期且无法直接访问私有/最新数据，RAG 解决此信息缺失问题
- 方法/机制：外部文档→切分(Split)→向量化(Embedding)→存储向量数据库→用户提问→检索相关Chunk→输入LLM生成答案
- 结论/价值：RAG 是 LLM 连接私有知识的标准方案，基础 RAG 三步流程是所有高级 RAG 技巧的基础

## Key Claims
- **RAG 三步流程**：
  1. **Indexing（索引）**：加载外部文档 → 切分为 chunks → 向量化 → 存入向量数据库
  2. **Retrieval（检索）**：用户问题向量化 → 从向量库检索 top-k 相关 chunks
  3. **Generation（生成）**：将问题+检索结果作为上下文输入 LLM → 生成最终答案
- **Embedding（向量化）**：将文本转为捕获语义的固定长度向量；余弦相似度计算相关性
- **Chunking（切分）**：Embedding 模型 context window 有限（512-8192 tokens），需将文档切分为满足窗口的 chunks
- **LangChain**：RAG 主流开发框架，160+ 文档加载器，支持多种向量数据库
- Embedding 模型选择：开源（BAAI 系列）为主流方案

## Key Concepts
- [[RAG]]（检索增强生成）：解决 LLM 知识时效性和私有数据访问问题的标准方案
- [[Indexing]]：RAG 第一步，文档→chunk→vector→vectorDB
- [[Embedding]]：文本→语义向量的转换过程，是 RAG 检索的核心
- [[Chunking]]：将长文档切分为适合 embedding 模型 context window 的小块
- [[向量数据库]]：存储 embedding vectors 的数据库，支持余弦相似度检索

## Connections
- [[RAG]] ← is_composed_of ← [[Indexing]] + [[Retrieval]] + [[Generation]]
- [[Embedding]] ← is_step_in ← [[Indexing]]
- [[Chunking]] ← is_step_in ← [[Indexing]]

## Contradictions
- （无已知冲突）