Auto-sync: update nexus workspace
This commit is contained in:
@@ -1,35 +1,26 @@
|
||||
---
|
||||
title: "RAG"
|
||||
type: concept
|
||||
tags: [rag, retrieval, llm, ai]
|
||||
last_updated: 2026-04-27
|
||||
tags: [rag, retrieval, llm, knowledge]
|
||||
aliases: [RAG, Retrieval-Augmented Generation, 检索增强生成]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## Definition
|
||||
检索增强生成(Retrieval-Augmented Generation,RAG)是将大语言模型(LLM)链接到外部实时知识库的技术,通过检索+生成的流程提升答案准确性和时效性。
|
||||
Retrieval-Augmented Generation(RAG),检索增强生成,通过从外部知识库检索相关信息来增强大语言模型的回答质量,解决模型在陌生领域的幻觉(Hallucination)问题。
|
||||
|
||||
## Core Mechanism
|
||||
1. **检索(Retrieval)**:当用户提问时,从外部知识库(向量数据库/知识图谱/公司文档)中检索最相关的信息块(Chunk)
|
||||
2. **增强生成(Augmented Generation)**:将检索结果与用户问题作为上下文输入 LLM,指示其严格基于上下文生成答案
|
||||
## Key Facts
|
||||
- 大模型在陌生领域容易产生幻觉,"一本正经胡说八道"
|
||||
- RAG 通过给模型"一些提示",引导其在正确方向上回答
|
||||
- 效果案例:正确率从 60% 提升至 90%
|
||||
- RAG 依赖 [[Embedding]] 技术实现语义检索
|
||||
- 典型 RAG 流程:用户问题 → 检索外部知识 → 将检索结果注入 Prompt → LLM 生成回答
|
||||
|
||||
## Key Benefits
|
||||
- **知识更新与定制**:无需重新训练即可获取最新信息
|
||||
- **消除幻觉**:提供事实依据,显著降低胡说八道的风险
|
||||
- **引用来源**:可追溯信息来源,增加可信度
|
||||
- **成本效益**:相比微调,成本更低、更新更快
|
||||
|
||||
## Role in AI System Architecture
|
||||
- **认知层**:RAG 作为 AI 系统的"记忆系统",负责信息获取与准确性保障
|
||||
- 为 [[AI Agent]] 提供可信赖的信息来源
|
||||
## Connections
|
||||
- [[Embedding]] ← 依赖 ← [[RAG]]
|
||||
- [[Hallucination]] ← 解决 ← [[RAG]]
|
||||
- [[Large Language Model]] ← 增强 ← [[RAG]]
|
||||
- [[LangChain]] ← 支持 ← [[RAG]]
|
||||
|
||||
## Sources
|
||||
- [[llms-rag-ai-agent-三个到底什么区别]]
|
||||
- [[rag从入门到精通系列1-基础rag]]
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|
||||
- [[knowledge-base-rag]]
|
||||
|
||||
## Related Concepts
|
||||
- [[Large Language Model]] — 被增强的底层模型
|
||||
- [[AI Agent]] — 依赖 RAG 提供准确信息
|
||||
- [[Hybrid Search]] — RAG 常用检索策略
|
||||
- [[Semantic Search]] — 向量检索的核心技术
|
||||
|
||||
Reference in New Issue
Block a user