Update nexus wiki content
This commit is contained in:
@@ -1,26 +1,37 @@
|
||||
---
|
||||
title: "RAG"
|
||||
type: concept
|
||||
tags: [rag, retrieval, llm, knowledge]
|
||||
aliases: [RAG, Retrieval-Augmented Generation, 检索增强生成]
|
||||
last_updated: 2025-12-20
|
||||
tags: [AI, knowledge-base, retrieval]
|
||||
sources: [karpathy-最新分享-用-llm-搭建个人知识库-告别-rag-的低效循环, llm-wiki, 大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏, llms-rag-ai-agent三个到底什么区别]
|
||||
last_updated: 2026-04-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
Retrieval-Augmented Generation(RAG),检索增强生成,通过从外部知识库检索相关信息来增强大语言模型的回答质量,解决模型在陌生领域的幻觉(Hallucination)问题。
|
||||
## Aliases
|
||||
- Retrieval-Augmented Generation
|
||||
- 检索增强生成
|
||||
|
||||
## Key Facts
|
||||
- 大模型在陌生领域容易产生幻觉,"一本正经胡说八道"
|
||||
- RAG 通过给模型"一些提示",引导其在正确方向上回答
|
||||
- 效果案例:正确率从 60% 提升至 90%
|
||||
- RAG 依赖 [[Embedding]] 技术实现语义检索
|
||||
- 典型 RAG 流程:用户问题 → 检索外部知识 → 将检索结果注入 Prompt → LLM 生成回答
|
||||
## Definition
|
||||
Retrieval-Augmented Generation(RAG,检索增强生成)——一种通过外部文档检索消除大模型幻觉、提升回答准确性的技术方案。用户上传文档后,AI 在回答时实时检索相关片段并拼接入答案。典型应用:NotebookLM、ChatGPT 文件上传。
|
||||
|
||||
## Key Properties
|
||||
- 每次查询从零检索,无持久化积累
|
||||
- 综合多文档时,需要"现场找碎片、现场拼"
|
||||
- RAG 通过"给提示"解决大模型在陌生领域的幻觉问题
|
||||
- 正确率可从 60% 提升至 90%([[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]])
|
||||
|
||||
## Limitations
|
||||
- **没有积累**:每次提问 AI 都在从头搜寻知识,什么都没沉淀
|
||||
- **维护成本高**:需要持续维护文档库,但 AI 不会自动更新交叉引用
|
||||
- Karpathy 指出:人类放弃 Wiki 是因为**维护成本的增长速度超过了价值的增长速度**
|
||||
|
||||
## Contrast: RAG vs LLM Wiki
|
||||
| 维度 | RAG | [[LLM Wiki]] |
|
||||
|------|-----|--------------|
|
||||
| 知识状态 | 每次查询从零 | 持久化积累 |
|
||||
| 交叉引用 | 无 | 自动维护 |
|
||||
| 多文档综合 | 临时拼接 | 预编译 |
|
||||
| 维护者 | 人类 | AI(趋近于零成本)|
|
||||
|
||||
## Connections
|
||||
- [[Embedding]] ← 依赖 ← [[RAG]]
|
||||
- [[Hallucination]] ← 解决 ← [[RAG]]
|
||||
- [[Large Language Model]] ← 增强 ← [[RAG]]
|
||||
- [[LangChain]] ← 支持 ← [[RAG]]
|
||||
|
||||
## Sources
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
- [[LLM Wiki]] ← 对比/替代 ← RAG
|
||||
- [[RAG]] ← 基础概念 → [[LLM Wiki]]
|
||||
|
||||
Reference in New Issue
Block a user