Files
nexus/wiki/sources/rag-cong-ru-men-dao-jing-tong-xi-lie-1.md
2026-04-14 16:02:50 +08:00

1.7 KiB
Raw Blame History

title, type, tags, sources, date
title type tags sources date
RAG从入门到精通系列1基础RAG source
RAG
LLM
检索增强生成
向量数据库
https://mp.weixin.qq.com/s/TlFNOw7_3Q8qywKLpVUmfg
2025-12-18

Summary

  • 核心主题RAG基础概念与实现流程
  • 问题域如何将LLM与外部数据源连接
  • 方法/机制Indexing → Retrieval → Generation三阶段流程
  • 结论/价值RAG是连接LLM与外部私有/最新数据的通用方法

Key Claims

  • RAG = Retrieval Augmented Generation将LLM与外部数据源连接
  • 三阶段Indexing文档索引、Retrieval检索、Generation生成
  • Embedding Model将文本转为固定长度向量受Context Window限制
  • 向量数据库Qdrant等存储Embedding Vector并实现相似度检索
  • LangChain/LlamaIndex等框架简化RAG流程

Key Concepts

  • RAG检索增强生成将LLM与外部数据源连接的通用方法
  • Indexing:将外部文档切分并建立索引的过程
  • Retrieval:根据问题语义向量检索相关文档
  • Generation:将问题+知识片段输入LLM生成答案
  • Embedding Vector:文本的数值表示,捕获语义信息
  • Vector Store存储Embedding Vector并实现相似度检索的数据库
  • Context WindowEmbedding Model能接受的最大token数

Connections

Contradictions

  • LLM Wiki冲突:
    • 冲突点:知识获取方式
    • 当前观点RAG从外部检索获取最新/私有数据
    • LLM Wiki观点:增量累积知识到内部记忆