Auto-sync: update nexus workspace

2026-04-28 07:26:52 +08:00
parent b83b4e3105
commit 3224ec4787
436 changed files with 17107 additions and 15920 deletions
--- a/wiki/concepts/RAG.md
+++ b/wiki/concepts/RAG.md
@@ -1,35 +1,26 @@
 ---
 title: "RAG"
 type: concept
-tags: [rag, retrieval, llm, ai]
-last_updated: 2026-04-27
+tags: [rag, retrieval, llm, knowledge]
+aliases: [RAG, Retrieval-Augmented Generation, 检索增强生成]
+last_updated: 2025-12-20
 ---

 ## Definition
-检索增强生成（Retrieval-Augmented Generation，RAG）是将大语言模型（LLM）链接到外部实时知识库的技术，通过检索+生成的流程提升答案准确性和时效性。
+Retrieval-Augmented Generation（RAG），检索增强生成，通过从外部知识库检索相关信息来增强大语言模型的回答质量，解决模型在陌生领域的幻觉（Hallucination）问题。

-## Core Mechanism
-1. **检索（Retrieval）**：当用户提问时，从外部知识库（向量数据库/知识图谱/公司文档）中检索最相关的信息块（Chunk）
-2. **增强生成（Augmented Generation）**：将检索结果与用户问题作为上下文输入 LLM，指示其严格基于上下文生成答案
+## Key Facts
+- 大模型在陌生领域容易产生幻觉，"一本正经胡说八道"
+- RAG 通过给模型"一些提示"，引导其在正确方向上回答
+- 效果案例：正确率从 60% 提升至 90%
+- RAG 依赖 [[Embedding]] 技术实现语义检索
+- 典型 RAG 流程：用户问题 → 检索外部知识 → 将检索结果注入 Prompt → LLM 生成回答

-## Key Benefits
- **知识更新与定制**：无需重新训练即可获取最新信息
- **消除幻觉**：提供事实依据，显著降低胡说八道的风险
- **引用来源**：可追溯信息来源，增加可信度
- **成本效益**：相比微调，成本更低、更新更快
-
-## Role in AI System Architecture
- **认知层**：RAG 作为 AI 系统的"记忆系统"，负责信息获取与准确性保障
- 为 [[AI Agent]] 提供可信赖的信息来源
+## Connections
+- [[Embedding]] ← 依赖 ← [[RAG]]
+- [[Hallucination]] ← 解决 ← [[RAG]]
+- [[Large Language Model]] ← 增强 ← [[RAG]]
+- [[LangChain]] ← 支持 ← [[RAG]]

 ## Sources
- [[llms-rag-ai-agent-三个到底什么区别]]
- [[rag从入门到精通系列1-基础rag]]
 - [[大模型相关术语和框架总结｜llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
- [[knowledge-base-rag]]
-
-## Related Concepts
- [[Large Language Model]] — 被增强的底层模型
- [[AI Agent]] — 依赖 RAG 提供准确信息
- [[Hybrid Search]] — RAG 常用检索策略
- [[Semantic Search]] — 向量检索的核心技术