Auto-sync: 2026-04-18 00:18
This commit is contained in:
24
wiki/concepts/Fallback-机制.md
Normal file
24
wiki/concepts/Fallback-机制.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "Fallback 机制"
|
||||
type: concept
|
||||
tags: [ai-agent, model, routing]
|
||||
last_updated: 2026-04-18
|
||||
---
|
||||
|
||||
## Definition
|
||||
当默认模型不可用或出现问题时,AI Agent 系统自动切换到备选模型的机制。
|
||||
|
||||
## Trigger Conditions
|
||||
1. **显式的 API 服务不可用**:503/502/429/Connection Timeout
|
||||
2. **隐性的 Token 长度溢出预判**:估计 Token 接近模型上限
|
||||
3. **配置文件的"优先级"覆盖**:Agent/Channel 特定配置覆盖全局配置
|
||||
4. **节点选择算法**:负载均衡/随机分发可能选中备选模型
|
||||
|
||||
## Problem
|
||||
Fallback 机制可能切到一个比原模型更小的模型(如 16K vs 200K),导致立即 overflow。
|
||||
|
||||
## Related
|
||||
- [[上下文压缩]] — OpenClaw 的 compaction 机制
|
||||
- [[模型配置层级]] — Global Config、Agent Specific Config、环境变量的分层
|
||||
- [[MiniMax-M2.7]] — 作者的默认模型,200K context
|
||||
- [[DeepSeek-Reasoner]] — 只有 16K context 的模型
|
||||
Reference in New Issue
Block a user