title, type, tags, sources, last_updated
| title |
type |
tags |
sources |
last_updated |
| RAG |
concept |
| AI |
| knowledge-base |
| retrieval |
|
| karpathy-最新分享-用-llm-搭建个人知识库-告别-rag-的低效循环 |
| llm-wiki |
| 大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏 |
| llms-rag-ai-agent三个到底什么区别 |
|
2026-04-20 |
Aliases
- Retrieval-Augmented Generation
- 检索增强生成
Definition
Retrieval-Augmented Generation(RAG,检索增强生成)——一种通过外部文档检索消除大模型幻觉、提升回答准确性的技术方案。用户上传文档后,AI 在回答时实时检索相关片段并拼接入答案。典型应用:NotebookLM、ChatGPT 文件上传。
Key Properties
Limitations
- 没有积累:每次提问 AI 都在从头搜寻知识,什么都没沉淀
- 维护成本高:需要持续维护文档库,但 AI 不会自动更新交叉引用
- Karpathy 指出:人类放弃 Wiki 是因为维护成本的增长速度超过了价值的增长速度
Contrast: RAG vs LLM Wiki
| 维度 |
RAG |
LLM Wiki |
| 知识状态 |
每次查询从零 |
持久化积累 |
| 交叉引用 |
无 |
自动维护 |
| 多文档综合 |
临时拼接 |
预编译 |
| 维护者 |
人类 |
AI(趋近于零成本) |
Connections