nexus/wiki/sources/RAG从入门到精通系列1-基础RAG.md at 177469a1cd83213c28b0f338bc408e8a52107fa0 - nexus - Gitea: Git with a cup of tea

ishenwei/nexus

Files

weishen 7d361490b2 Auto-sync: 2026-04-18 12:03

2026-04-18 12:03:16 +08:00

2.4 KiB

Raw Blame History

title, type, tags, date

title

type

tags

date

RAG从入门到精通系列1：基础RAG

source

RAG

LLM

教程

2025-12-18

Source File

raw/AI/RAG从入门到精通系列1：基础RAG.md

Summary

核心主题：基础 RAG（检索增强生成）技术介绍
问题域：LLM 如何使用外部数据（私有数据或最新数据）
方法/机制：Indexing（索引）→ Retrieval（检索）→ Generation（生成）
结论/价值：RAG 是连接 LLM 与外部数据源的通用方法，使 LLM 能基于外部知识生成回答

Key Claims

RAG 是一种将 LLM 与外部数据源连接的通用方法，允许 LLM 使用外部数据生成输出
基础 RAG 流程包含三个核心阶段：索引构建、文档检索、答案生成
Embedding（向量化）将文本转为固定长度的数值向量，捕获文本语义
文档需要切分成满足 Embedding Model Context Window 的 Split（文档块）
Vector Store（向量数据库）存储 Embedding Vector 并实现相似度比较
LangChain 和 LlamaIndex 框架简化了 RAG 管道的构建

Key Quotes

"RAG（Retrieval Augmented Generation，检索增强生成）是一种将 LLM 与外部数据源（例如私有数据或最新数据）连接的通用方法。它允许 LLM 使用外部数据来生成其输出。"

Key Concepts

RAG：检索增强生成，连接 LLM 与外部数据源的技术
LLM：大型语言模型，功能强大但不总是使用最新或相关数据
向量嵌入：将文本转换为数值向量，捕获语义信息
Token：模型处理文本的基本单位，中文约 1 token/汉字，英文约 1 token/3-4 字母
Vector Store：向量数据库，存储 Embedding Vector 并实现相似度检索
LangChain：简化 RAG 管道构建的框架
Qdrant：Rust 编写的开源向量数据库

Key Entities

LangChain：提供 160+ 文档加载器的 RAG 框架
Qwen：文中使用的 LLM 示例
BAAI：开源 Embedding Model 系列
PyTorch研习社：文章来源公众号

Connections

RAG ← depends_on ← 向量嵌入
向量嵌入 ← depends_on ← Token
LangChain ← implements ← RAG
Qdrant ← stores ← 向量嵌入
Qwen ← provides ← LLM

Contradictions

（暂无）

相关技术栈

LLM: Qwen
Embedding Model: BAAI 系列
Vector Store: Qdrant
Framework: LangChain