1.4 KiB
1.4 KiB
title, type, tags, date
| title | type | tags | date | ||||
|---|---|---|---|---|---|---|---|
| RAG从入门到精通系列1:基础RAG | source |
|
2025-12-18 |
Source File
Summary
- 核心主题:RAG基础概念和实现流程
- 问题域:LLM缺乏最新和私有数据
- 方法/机制:索引→检索→生成的三步流程
- 结论/价值:RAG是连接LLM与外部数据源的通用方法
Key Claims
- RAG = Retrieval Augmented Generation,检索增强生成
- Indexing:将文档切分并转换为Embedding向量存入向量数据库
- Retrieval:根据问题语义向量检索相关文档块
- Generation:将问题和相关文档输入LLM生成答案
- Embedding Model的Context Window有限(512-8192 token),需切分文档
Key Concepts
- RAG:检索增强生成
- Embedding:将文本转换为数值向量的技术
- 向量数据库:存储和检索向量表示的数据库
- 文档切分:将长文档分割成符合Embedding窗口的块
- Context Window:模型能接受的上下文长度限制