42 lines
1.7 KiB
Markdown
42 lines
1.7 KiB
Markdown
---
|
||
title: "RAG从入门到精通系列1:基础RAG"
|
||
type: source
|
||
tags: [RAG, LLM, 检索增强生成, 向量数据库]
|
||
sources: ["https://mp.weixin.qq.com/s/TlFNOw7_3Q8qywKLpVUmfg"]
|
||
date: 2025-12-18
|
||
---
|
||
|
||
## Summary
|
||
- 核心主题:RAG基础概念与实现流程
|
||
- 问题域:如何将LLM与外部数据源连接
|
||
- 方法/机制:Indexing → Retrieval → Generation三阶段流程
|
||
- 结论/价值:RAG是连接LLM与外部私有/最新数据的通用方法
|
||
|
||
## Key Claims
|
||
- RAG = Retrieval Augmented Generation,将LLM与外部数据源连接
|
||
- 三阶段:Indexing(文档索引)、Retrieval(检索)、Generation(生成)
|
||
- Embedding Model将文本转为固定长度向量,受Context Window限制
|
||
- 向量数据库(Qdrant等)存储Embedding Vector并实现相似度检索
|
||
- LangChain/LlamaIndex等框架简化RAG流程
|
||
|
||
## Key Concepts
|
||
- [[RAG]](检索增强生成):将LLM与外部数据源连接的通用方法
|
||
- [[Indexing]]:将外部文档切分并建立索引的过程
|
||
- [[Retrieval]]:根据问题语义向量检索相关文档
|
||
- [[Generation]]:将问题+知识片段输入LLM生成答案
|
||
- [[Embedding Vector]]:文本的数值表示,捕获语义信息
|
||
- [[Vector Store]]:存储Embedding Vector并实现相似度检索的数据库
|
||
- [[Context Window]]:Embedding Model能接受的最大token数
|
||
|
||
## Connections
|
||
- [[RAG]] ← 包含 ← [[Indexing]]
|
||
- [[RAG]] ← 包含 ← [[Retrieval]]
|
||
- [[RAG]] ← 包含 ← [[Generation]]
|
||
- [[LLM]] ← 扩展 ← [[RAG]]
|
||
|
||
## Contradictions
|
||
- 与[[LLM Wiki]]冲突:
|
||
- 冲突点:知识获取方式
|
||
- 当前观点:RAG从外部检索获取最新/私有数据
|
||
- [[LLM Wiki]]观点:增量累积知识到内部记忆
|