Auto-sync: 2026-04-28 00:02

This commit is contained in:
2026-04-28 00:02:50 +08:00
parent de7ebe9256
commit b574c99af6
31 changed files with 1710 additions and 1212 deletions

View File

@@ -1,32 +1,36 @@
---
title: "Context Window"
type: concept
tags: [llm, context-window, token, embedding, rag]
last_updated: 2025-01-16
---
## Definition
Context Window上下文窗口是 LLM 或 Embedding Model 一次性处理的最大 token 数量。超过该限制的内容无法被模型感知,必须切分或截断。
## Key Numbers
- **Embedding Model**:通常 512~8192 token如 BAAI/bge 系列)
- **LLM**:差异极大,从 4KGPT-3.5)到 200K+Claude 3不等
## Practical Impact
### 对 Embedding Model
- 决定单次可 Embedding 的最大文本长度
- 超过则需 Split切分文档
### 对 LLMGeneration 阶段)
- 决定用户问题 + 检索上下文 + 系统 Prompt 的总 token 预算
- 超过则需截断(可能丢失关键信息
## Token Estimation
- **英文**1 token ≈ 3~4 个字母
- **中文**1 token ≈ 1 个汉字
## Related Concepts
- [[Split]] — 文档需要切分以满足 Context Window 约束
- [[Embedding]] — Embedding Model 的 Context Window 限制
- [[Token]] — Context Window 的计量单位
- [[Generation]] — LLM 的 Context Window 决定最终可输入的上下文量
---
title: "Context Window"
type: concept
tags: [llm, context-window, token, embedding, rag]
last_updated: 2026-04-10
---
## Sources
- [[养虾日记4-一次「context-limit-exceeded」错误排查-我以为是小问题-结果踩了大坑]]
## Definition
Context Window上下文窗口是 LLM 或 Embedding Model 一次性处理的最大 token 数量。超过该限制的内容无法被模型感知,必须切分或截断。
## Key Numbers
- **Embedding Model**:通常 512~8192 token如 BAAI/bge 系列)
- **LLM**:差异极大,从 4KGPT-3.5)到 200K+Claude 3不等
## Practical Impact
### 对 Embedding Model
- 决定单次可 Embedding 的最大文本长度
- 超过则需 Split切分文档
### 对 LLMGeneration 阶段)
- 决定用户问题 + 检索上下文 + 系统 Prompt 的总 token 预算
- 超过则需截断(可能丢失关键信息)
## Token Estimation
- **英文**1 token ≈ 3~4 个字母
- **中文**1 token ≈ 1 个汉字
## Related Concepts
- [[Split]] — 文档需要切分以满足 Context Window 约束
- [[Embedding]] — Embedding Model 的 Context Window 限制
- [[Token]] — Context Window 的计量单位
- [[Generation]] — LLM 的 Context Window 决定最终可输入的上下文量