Files
nexus/wiki/concepts/RAG.md
2026-05-03 05:42:12 +08:00

38 lines
1.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "RAG"
type: concept
tags: [AI, knowledge-base, retrieval]
sources: [karpathy-最新分享-用-llm-搭建个人知识库-告别-rag-的低效循环, llm-wiki, 大模型相关术语和框架总结llm-mcp-prompt-rag-vllm-token-数据蒸馏, llms-rag-ai-agent三个到底什么区别]
last_updated: 2026-04-20
---
## Aliases
- Retrieval-Augmented Generation
- 检索增强生成
## Definition
Retrieval-Augmented GenerationRAG检索增强生成——一种通过外部文档检索消除大模型幻觉、提升回答准确性的技术方案。用户上传文档后AI 在回答时实时检索相关片段并拼接入答案。典型应用NotebookLM、ChatGPT 文件上传。
## Key Properties
- 每次查询从零检索,无持久化积累
- 综合多文档时,需要"现场找碎片、现场拼"
- RAG 通过"给提示"解决大模型在陌生领域的幻觉问题
- 正确率可从 60% 提升至 90%[[大模型相关术语和框架总结llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
## Limitations
- **没有积累**:每次提问 AI 都在从头搜寻知识,什么都没沉淀
- **维护成本高**:需要持续维护文档库,但 AI 不会自动更新交叉引用
- Karpathy 指出:人类放弃 Wiki 是因为**维护成本的增长速度超过了价值的增长速度**
## Contrast: RAG vs LLM Wiki
| 维度 | RAG | [[LLM Wiki]] |
|------|-----|--------------|
| 知识状态 | 每次查询从零 | 持久化积累 |
| 交叉引用 | 无 | 自动维护 |
| 多文档综合 | 临时拼接 | 预编译 |
| 维护者 | 人类 | AI趋近于零成本|
## Connections
- [[LLM Wiki]] ← 对比/替代 ← RAG
- [[RAG]] ← 基础概念 → [[LLM Wiki]]