1.7 KiB
1.7 KiB
title, type, tags, sources, date
| title | type | tags | sources | date | |||||
|---|---|---|---|---|---|---|---|---|---|
| RAG从入门到精通系列1:基础RAG | source |
|
|
2025-12-18 |
Summary
- 核心主题:RAG基础概念与实现流程
- 问题域:如何将LLM与外部数据源连接
- 方法/机制:Indexing → Retrieval → Generation三阶段流程
- 结论/价值:RAG是连接LLM与外部私有/最新数据的通用方法
Key Claims
- RAG = Retrieval Augmented Generation,将LLM与外部数据源连接
- 三阶段:Indexing(文档索引)、Retrieval(检索)、Generation(生成)
- Embedding Model将文本转为固定长度向量,受Context Window限制
- 向量数据库(Qdrant等)存储Embedding Vector并实现相似度检索
- LangChain/LlamaIndex等框架简化RAG流程
Key Concepts
- RAG(检索增强生成):将LLM与外部数据源连接的通用方法
- Indexing:将外部文档切分并建立索引的过程
- Retrieval:根据问题语义向量检索相关文档
- Generation:将问题+知识片段输入LLM生成答案
- Embedding Vector:文本的数值表示,捕获语义信息
- Vector Store:存储Embedding Vector并实现相似度检索的数据库
- Context Window:Embedding Model能接受的最大token数