feat(wiki): deep ingest batch 3 (19 source pages, AI dir focus)

This commit is contained in:
2026-04-14 21:56:47 +08:00
parent 483d6fcae2
commit aec1052b8e
7 changed files with 291 additions and 51 deletions

View File

@@ -0,0 +1,42 @@
---
title: "RAG 从入门到精通系列1基础 RAG 完全指南"
type: source
tags: ['RAG', 'LLM', '检索增强生成', 'Embedding', '向量数据库', 'LangChain', '教程']
date: 2025-01-16
source: https://mp.weixin.qq.com/s/
author: 南七无名式
---
## Source File
- [[raw/AI/RAG从入门到精通系列1基础RAG.md]]
## Summary
- 核心主题RAG检索增强生成基础概念与三步流程Indexing→Retrieval→Generation详解
- 问题域LLM 知识有截止日期且无法直接访问私有/最新数据RAG 解决此信息缺失问题
- 方法/机制:外部文档→切分(Split)→向量化(Embedding)→存储向量数据库→用户提问→检索相关Chunk→输入LLM生成答案
- 结论/价值RAG 是 LLM 连接私有知识的标准方案,基础 RAG 三步流程是所有高级 RAG 技巧的基础
## Key Claims
- **RAG 三步流程**
1. **Indexing索引**:加载外部文档 → 切分为 chunks → 向量化 → 存入向量数据库
2. **Retrieval检索**:用户问题向量化 → 从向量库检索 top-k 相关 chunks
3. **Generation生成**:将问题+检索结果作为上下文输入 LLM → 生成最终答案
- **Embedding向量化**:将文本转为捕获语义的固定长度向量;余弦相似度计算相关性
- **Chunking切分**Embedding 模型 context window 有限512-8192 tokens需将文档切分为满足窗口的 chunks
- **LangChain**RAG 主流开发框架160+ 文档加载器,支持多种向量数据库
- Embedding 模型选择开源BAAI 系列)为主流方案
## Key Concepts
- [[RAG]](检索增强生成):解决 LLM 知识时效性和私有数据访问问题的标准方案
- [[Indexing]]RAG 第一步文档→chunk→vector→vectorDB
- [[Embedding]]:文本→语义向量的转换过程,是 RAG 检索的核心
- [[Chunking]]:将长文档切分为适合 embedding 模型 context window 的小块
- [[向量数据库]]:存储 embedding vectors 的数据库,支持余弦相似度检索
## Connections
- [[RAG]] ← is_composed_of ← [[Indexing]] + [[Retrieval]] + [[Generation]]
- [[Embedding]] ← is_step_in ← [[Indexing]]
- [[Chunking]] ← is_step_in ← [[Indexing]]
## Contradictions
- (无已知冲突)