--- title: "RAG" type: concept tags: [AI, knowledge-base, retrieval] sources: [karpathy-最新分享-用-llm-搭建个人知识库-告别-rag-的低效循环, llm-wiki, 大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏, llms-rag-ai-agent三个到底什么区别] last_updated: 2026-04-20 --- ## Aliases - Retrieval-Augmented Generation - 检索增强生成 ## Definition Retrieval-Augmented Generation(RAG,检索增强生成)——一种通过外部文档检索消除大模型幻觉、提升回答准确性的技术方案。用户上传文档后,AI 在回答时实时检索相关片段并拼接入答案。典型应用:NotebookLM、ChatGPT 文件上传。 ## Key Properties - 每次查询从零检索,无持久化积累 - 综合多文档时,需要"现场找碎片、现场拼" - RAG 通过"给提示"解决大模型在陌生领域的幻觉问题 - 正确率可从 60% 提升至 90%([[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]) ## Limitations - **没有积累**:每次提问 AI 都在从头搜寻知识,什么都没沉淀 - **维护成本高**:需要持续维护文档库,但 AI 不会自动更新交叉引用 - Karpathy 指出:人类放弃 Wiki 是因为**维护成本的增长速度超过了价值的增长速度** ## Contrast: RAG vs LLM Wiki | 维度 | RAG | [[LLM Wiki]] | |------|-----|--------------| | 知识状态 | 每次查询从零 | 持久化积累 | | 交叉引用 | 无 | 自动维护 | | 多文档综合 | 临时拼接 | 预编译 | | 维护者 | 人类 | AI(趋近于零成本)| ## Connections - [[LLM Wiki]] ← 对比/替代 ← RAG - [[RAG]] ← 基础概念 → [[LLM Wiki]]