nexus/wiki/sources/rag-cong-ru-men-dao-jing-tong-xi-lie-1.md at c6e3d3c5db79e3b95192674455dab92a2b8f3811 - nexus - Gitea: Git with a cup of tea

ishenwei/nexus

Files

weishen c6e3d3c5db 新增wiki命令文件

2026-04-14 16:02:50 +08:00

1.7 KiB

Raw Blame History

title, type, tags, sources, date

title

type

tags

sources

date

RAG从入门到精通系列1：基础RAG

source

RAG

LLM

检索增强生成

向量数据库

https://mp.weixin.qq.com/s/TlFNOw7_3Q8qywKLpVUmfg

2025-12-18

Summary

核心主题：RAG基础概念与实现流程
问题域：如何将LLM与外部数据源连接
方法/机制：Indexing → Retrieval → Generation三阶段流程
结论/价值：RAG是连接LLM与外部私有/最新数据的通用方法

Key Claims

RAG = Retrieval Augmented Generation，将LLM与外部数据源连接
三阶段：Indexing（文档索引）、Retrieval（检索）、Generation（生成）
Embedding Model将文本转为固定长度向量，受Context Window限制
向量数据库（Qdrant等）存储Embedding Vector并实现相似度检索
LangChain/LlamaIndex等框架简化RAG流程

Key Concepts

RAG（检索增强生成）：将LLM与外部数据源连接的通用方法
Indexing：将外部文档切分并建立索引的过程
Retrieval：根据问题语义向量检索相关文档
Generation：将问题+知识片段输入LLM生成答案
Embedding Vector：文本的数值表示，捕获语义信息
Vector Store：存储Embedding Vector并实现相似度检索的数据库
Context Window：Embedding Model能接受的最大token数

Connections

RAG ← 包含 ← Indexing
RAG ← 包含 ← Retrieval
RAG ← 包含 ← Generation
LLM ← 扩展 ← RAG

Contradictions

与LLM Wiki冲突：
- 冲突点：知识获取方式
- 当前观点：RAG从外部检索获取最新/私有数据
- LLM Wiki观点：增量累积知识到内部记忆