Files
nexus/wiki/sources/rag-cong-ru-men-dao-jing-tong-xi-lie-1.md
2026-04-14 16:02:50 +08:00

42 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "RAG从入门到精通系列1基础RAG"
type: source
tags: [RAG, LLM, 检索增强生成, 向量数据库]
sources: ["https://mp.weixin.qq.com/s/TlFNOw7_3Q8qywKLpVUmfg"]
date: 2025-12-18
---
## Summary
- 核心主题RAG基础概念与实现流程
- 问题域如何将LLM与外部数据源连接
- 方法/机制Indexing → Retrieval → Generation三阶段流程
- 结论/价值RAG是连接LLM与外部私有/最新数据的通用方法
## Key Claims
- RAG = Retrieval Augmented Generation将LLM与外部数据源连接
- 三阶段Indexing文档索引、Retrieval检索、Generation生成
- Embedding Model将文本转为固定长度向量受Context Window限制
- 向量数据库Qdrant等存储Embedding Vector并实现相似度检索
- LangChain/LlamaIndex等框架简化RAG流程
## Key Concepts
- [[RAG]]检索增强生成将LLM与外部数据源连接的通用方法
- [[Indexing]]:将外部文档切分并建立索引的过程
- [[Retrieval]]:根据问题语义向量检索相关文档
- [[Generation]]:将问题+知识片段输入LLM生成答案
- [[Embedding Vector]]:文本的数值表示,捕获语义信息
- [[Vector Store]]存储Embedding Vector并实现相似度检索的数据库
- [[Context Window]]Embedding Model能接受的最大token数
## Connections
- [[RAG]] ← 包含 ← [[Indexing]]
- [[RAG]] ← 包含 ← [[Retrieval]]
- [[RAG]] ← 包含 ← [[Generation]]
- [[LLM]] ← 扩展 ← [[RAG]]
## Contradictions
- 与[[LLM Wiki]]冲突:
- 冲突点:知识获取方式
- 当前观点RAG从外部检索获取最新/私有数据
- [[LLM Wiki]]观点:增量累积知识到内部记忆