Sync: add ai finops and deployment notes

This commit is contained in:
2026-04-26 12:35:45 +08:00
parent f09834b5a5
commit ecdf295ded
14 changed files with 7117 additions and 5832 deletions

32
wiki/concepts/AIFinOps.md Normal file
View File

@@ -0,0 +1,32 @@
---
title: "AIFinOps"
type: concept
tags: ["finops", "cost-optimization", "cloud-economics"]
sources: ["engineering-autonomous-optimization-architect"]
last_updated: 2026-04-26
---
## Aliases
- AI FinOps
- AI Financial Operations
- LLM Cost Management
## Definition
AI FinOpsFinancial Operations是 [[AutonomousOptimizationArchitect]] 的成本管理框架——持续追踪每个 LLM Provider 的 Token 消耗、成本、延迟和输出质量,建立历史性能数据库,为 [[SemanticRouting]] 提供成本感知的决策依据。目标是实现 AI 运营成本的可预测性和可控性。
## Mechanism
1. **遥测数据收集**:每次 API 调用记录 Token 数量、响应时间、错误率、成本
2. **成本建模**:按 Provider、模型、任务类型建立成本分解模型
3. **异常检测**:检测异常流量模式(如 500% 流量突增,可能为 bot 攻击)
4. **预算告警**:当成本接近阈值时触发告警
5. **优化建议**:基于历史数据生成成本优化建议(如切换到 Gemini Flash
## Key Properties
- **成本透明**:每百万 Token 成本精确追踪
- **可预测性**:基于历史趋势预测未来成本
- **与治理对齐**:为 [[CircuitBreaker]] 提供成本异常检测数据
## Connections
- [[AutonomousOptimizationArchitect]] — AIFinOps 是成本管理的核心框架
- [[SemanticRouting]] — 成本数据是路由决策的关键输入
- [[CircuitBreaker]] — 异常成本流量触发熔断保护