nexus/wiki/concepts/RAG.md

---
id: rag
title: "RAG"
type: concept
tags: [LLM, retrieval, augmentation]
sources:
  - "[[RAG从入门到精通系列1：基础RAG]]"
  - "[[LLM Terms Framework]]"
last_updated: 2025-12-18
---

## Definition

RAG（Retrieval Augmented Generation，检索增强生成）是一种结合检索系统和LLM生成的技术，解决LLM缺乏最新和私有数据的问题。

## Three-Step Process

1. **索引（Indexing）**：将文档切分并转换为Embedding向量存入向量数据库
2. **检索（Retrieval）**：根据问题语义向量检索相关文档块
3. **生成（Generation）**：将问题和相关文档输入LLM生成答案

## Key Components

- **Embedding**：将文本转换为数值向量
- **向量数据库**：存储和检索向量表示（如Qdrant）
- **文档切分**：将长文档分割成符合Embedding窗口的块
- **Context Window**：模型能接受的上下文长度限制（512-8192 token）

## Why It Matters

解决LLM的幻觉问题，让模型能够：
- 访问最新信息
- 利用私有数据
- 提供可溯源的回答

## Connections
- [[LLM]] ← uses ← [[RAG]]
- [[RAG]] ← includes ← [[索引]]
- [[RAG]] ← includes ← [[检索]]
- [[RAG]] ← includes ← [[生成]]
- [[RAG]] ← extends ← [[LLM]]