--- title: "RAG" type: concept tags: [rag, retrieval, llm, knowledge] aliases: [RAG, Retrieval-Augmented Generation, 检索增强生成] last_updated: 2025-12-20 --- ## Definition Retrieval-Augmented Generation(RAG),检索增强生成,通过从外部知识库检索相关信息来增强大语言模型的回答质量,解决模型在陌生领域的幻觉(Hallucination)问题。 ## Key Facts - 大模型在陌生领域容易产生幻觉,"一本正经胡说八道" - RAG 通过给模型"一些提示",引导其在正确方向上回答 - 效果案例:正确率从 60% 提升至 90% - RAG 依赖 [[Embedding]] 技术实现语义检索 - 典型 RAG 流程:用户问题 → 检索外部知识 → 将检索结果注入 Prompt → LLM 生成回答 ## Connections - [[Embedding]] ← 依赖 ← [[RAG]] - [[Hallucination]] ← 解决 ← [[RAG]] - [[Large Language Model]] ← 增强 ← [[RAG]] - [[LangChain]] ← 支持 ← [[RAG]] ## Sources - [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]