27 lines
1.0 KiB
Markdown
27 lines
1.0 KiB
Markdown
---
|
||
title: "RAG"
|
||
type: concept
|
||
tags: [rag, retrieval, llm, knowledge]
|
||
aliases: [RAG, Retrieval-Augmented Generation, 检索增强生成]
|
||
last_updated: 2025-12-20
|
||
---
|
||
|
||
## Definition
|
||
Retrieval-Augmented Generation(RAG),检索增强生成,通过从外部知识库检索相关信息来增强大语言模型的回答质量,解决模型在陌生领域的幻觉(Hallucination)问题。
|
||
|
||
## Key Facts
|
||
- 大模型在陌生领域容易产生幻觉,"一本正经胡说八道"
|
||
- RAG 通过给模型"一些提示",引导其在正确方向上回答
|
||
- 效果案例:正确率从 60% 提升至 90%
|
||
- RAG 依赖 [[Embedding]] 技术实现语义检索
|
||
- 典型 RAG 流程:用户问题 → 检索外部知识 → 将检索结果注入 Prompt → LLM 生成回答
|
||
|
||
## Connections
|
||
- [[Embedding]] ← 依赖 ← [[RAG]]
|
||
- [[Hallucination]] ← 解决 ← [[RAG]]
|
||
- [[Large Language Model]] ← 增强 ← [[RAG]]
|
||
- [[LangChain]] ← 支持 ← [[RAG]]
|
||
|
||
## Sources
|
||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]]
|