Files
nexus/wiki/concepts/Indexing.md
2026-04-14 16:02:50 +08:00

678 B
Raw Blame History

title, type, tags
title type tags
Indexing concept
RAG
索引
数据处理

Definition

Indexing是将外部文档切分并建立索引的过程是RAG的第一阶段。

Core Mechanism

  1. 文档加载Load
  2. 文档切分Split按段落、句子或Token切分
  3. 向量化Embed通过Embedding Model转为向量
  4. 存储Store存入Vector Store

Key Properties

  • 切分策略影响检索质量
  • 受Context Window限制
  • 需要平衡粒度

Connections