Files
nexus/wiki/sources/RAG从入门到精通系列1基础RAG.md
2026-04-16 13:01:42 +08:00

3.4 KiB
Raw Blame History

title, type, tags, date
title type tags date
RAG从入门到精通系列1基础RAG source
RAG
向量检索
LLM应用
2025-01-16

Source File

Summary

  • 核心主题RAG检索增强生成三阶段管道的完整技术栈与实操流程
  • 问题域LLM 自身知识有限、存在幻觉、无法访问最新信息的问题
  • 方法/机制Indexing文档→向量→ Retrieval查询→Top-K相关块→ Generation上下文→答案
  • 结论/价值RAG 将外部知识注入 LLM 上下文,考试正确率从 60% 提升至 90%,是 LLM 落地生产的标配架构

Key Claims

  • RAG 三阶段管道Indexing→Retrieval→Generation是 LLM 应用的事实标准架构
  • Indexing 阶段核心:文档加载 → 文本分块512~8192 token Context Window 限制)→ BAAI Embedding 向量化 → 存入 Qdrant 向量数据库
  • Retrieval 阶段核心:根据 Query 向量在 Vector Store 中按余弦相似度检索 Top-K 相关文档块
  • Generation 阶段核心Query + Top-K Context → PromptTemplate → LLM 生成答案
  • Embedding Model嵌入模型BAAI 系列)将文本转为固定长度向量,是语义检索的基础
  • 技术栈QwenLLM+ BAAIEmbedding+ LangChain编排+ Qdrant向量存储
  • LangSmith 是监控 RAG Pipeline 各环节Latency/Token/Trace的可视化调试工具

Key Quotes

"RAG 通过检索外部知识解决 LLM 幻觉,考试正确率从 60% 提升至 90%"

Key Concepts

  • RAG:检索增强生成,通过外部知识检索增强 LLM 回答质量
  • 向量检索:基于向量相似度(余弦相似度)在向量数据库中检索相关文档块
  • 文档分块:将长文档切分为适合 LLM Context Window 的小块512~8192 token
  • 嵌入向量:文本通过 Embedding Model 转为固定长度浮点数向量
  • 提示词模板:将 Query + Context 组装为 LLM 可处理的格式化提示词

Key Entities

  • Qwen通义千问大模型RAG Pipeline 中的 LLM 组件
  • BAAI:北京智源人工智能研究院,开源 Embedding 模型BAAI/bge
  • QdrantRust 编写的开源向量数据库RAG 的存储层
  • LangChainLLM 应用开发框架RAG Pipeline 编排
  • LangSmithLLM 应用监控调试平台,可视化 RAG 各环节 Latency 和 Trace
  • PyTorch研习社:微信公众号来源

Connections

Contradictions

  • LLM Wiki 相比:
    • 冲突点RAG 每次从零检索无记忆LLM Wiki 持久化积累
    • 当前观点Wiki 适合长期知识积累RAG 适合动态文档检索
    • 对方观点RAG 适合最新信息搜索Wiki 适合沉淀经验(记忆)
  • Dataview 相比:
    • 冲突点Dataview 基于结构化字段查询RAG 基于向量语义检索
    • 当前观点Dataview 适合元数据明确的笔记查询
    • 对方观点RAG 适合自然语言模糊查询,两者互补