Sync: add ai finops and deployment notes
This commit is contained in:
@@ -0,0 +1,52 @@
|
||||
---
|
||||
title: "Autonomous Optimization Architect"
|
||||
type: source
|
||||
tags: ["ai-finetuning", "llm-routing", "ai-fintech", "autonomous-agents", "cost-optimization"]
|
||||
date: 2026-04-26
|
||||
---
|
||||
|
||||
## Source File
|
||||
- [[Agent/agency-agents/engineering/engineering-autonomous-optimization-architect.md]]
|
||||
|
||||
## Summary(用中文描述)
|
||||
- 核心主题:LLM 驱动的自主优化与智能路由系统,通过影子测试持续评估和切换 AI 模型
|
||||
- 问题域:AI 系统运营成本失控、模型选择缺乏数据驱动、缺少金融级安全保障
|
||||
- 方法/机制:LLM-as-a-Judge 评分、影子流量测试、暗启动(Dark Launching)、熔断器(Circuit Breaker)、AI FinOps
|
||||
- 结论/价值:在保证 99.99% 稳定性的前提下,通过自动路由至更便宜/更快的模型实现 >40% 成本降低
|
||||
|
||||
## Key Claims(用中文描述)
|
||||
- 影子流量(Shadow Traffic)异步测试新模型,不影响生产环境稳定性的同时收集真实对比数据
|
||||
- 自主流量路由(Autonomous Traffic Routing):实验模型达到基准精度(如 98%)且成本更低(如 1/10)时,自动切换至该模型
|
||||
- 金融与安全护栏(Financial & Security Guardrails):每个外部请求必须配置超时、重试上限和廉价兜底方案,防止无限循环
|
||||
- 异常熔断(Halt on Anomaly):流量突增 500% 或出现 HTTP 402/429 错误时,立即触发熔断器并告警人工
|
||||
- 成本优先原则:提出 LLM 架构时必须同时给出每百万 Token 的主路径和兜底路径成本估算
|
||||
|
||||
## Key Quotes
|
||||
> "I have evaluated 1,000 shadow executions. The experimental model outperforms baseline by 14% on this specific task while reducing costs by 80%." — Autonomous Optimization Architect 通信风格
|
||||
> "Circuit breaker tripped on Provider A due to unusual failure velocity. Automating failover to Provider B to prevent token drain. Admin alerted." — 熔断触发时的标准告警语
|
||||
> "Autonomous routing without a circuit breaker is just an expensive bomb." — 该 Agent 的核心理念
|
||||
|
||||
## Key Concepts
|
||||
- [[CircuitBreaker]]:熔断器模式,当 Provider 失败频率超过阈值时自动切断并切换到廉价兜底方案
|
||||
- [[LLMasJudge]]:用 LLM 自动评估实验模型输出的质量,作为客观评分替代人工评审
|
||||
- [[ShadowTraffic]]:影子流量,将一小部分请求异步转发至实验模型,与生产结果对比评分
|
||||
- [[SemanticRouting]]:语义路由,根据任务类型和历史性能选择最优 Provider
|
||||
- [[DarkLaunching]]:暗启动/灰度发布,新模型在不影响用户的前提下逐步引入
|
||||
- [[AIFinOps]]:AI 云财务管理,跟踪每个 LLM 的 token 消耗、成本和延迟,建立历史性能排名
|
||||
|
||||
## Key Entities
|
||||
- [[OpenAI]]:主要 LLM Provider 之一,提供 GPT 系列模型
|
||||
- [[Anthropic]]:主要 LLM Provider,提供 Claude 系列模型
|
||||
- [[GoogleGemini]]:主要 LLM Provider,提供 Gemini Flash 等高性价比模型
|
||||
- [[Firecrawl]]:网页抓取 API,当 LLM Provider 不可用时的备选数据获取方案
|
||||
|
||||
## Connections
|
||||
- [[testing-workflow-optimizer]] ← uses ← [[AutonomousOptimizationArchitect]](工作流优化依赖路由决策)
|
||||
- [[backend-architect-with-memory]] ← depends_on ← [[AutonomousOptimizationArchitect]](后端架构依赖成本追踪记忆)
|
||||
- [[automation-governance-architect]] ← shares_guardrails ← [[AutonomousOptimizationArchitect]](自动化治理与本 Agent 均涉及安全护栏设计)
|
||||
|
||||
## Contradictions
|
||||
- 与 [[testing-performance-benchmarker]] 冲突:
|
||||
- 冲突点:性能基准测试强调人工驱动的静态评估,本 Agent 强调机器驱动的动态 A/B 测试
|
||||
- 当前观点:持续自动的影子测试比定期人工测试更能反映生产环境真实性能
|
||||
- 对方观点:性能基准测试提供可控、可复现的实验室数据,而非真实流量噪声
|
||||
56
wiki/sources/engineering-mobile-app-builder.md
Normal file
56
wiki/sources/engineering-mobile-app-builder.md
Normal file
@@ -0,0 +1,56 @@
|
||||
---
|
||||
title: "Mobile App Builder Agent Personality"
|
||||
type: source
|
||||
tags: []
|
||||
date: 2026-04-26
|
||||
---
|
||||
|
||||
## Source File
|
||||
- [[Agent/agency-agents/engineering/engineering-mobile-app-builder.md]]
|
||||
|
||||
## Summary(用中文描述)
|
||||
- 核心主题:Mobile App Builder — 专注于原生 iOS/Android 开发和跨平台框架的移动应用开发 AI Agent 人格规范
|
||||
- 问题域:如何在移动端构建高性能、平台原生体验的应用;原生开发与跨平台开发的选型决策;移动端特有的性能、续航、离线场景约束
|
||||
- 方法/机制:Swift/SwiftUI(iOS)、Kotlin/Jetpack Compose(Android)、React Native/Flutter(跨平台);MVVM 模式;Offline-First 架构;平台原生设计规范(Material Design / Human Interface Guidelines)
|
||||
- 结论/价值:移动开发 Agent 需要具备平台意识、性能优先、用户体验驱动的特质,同时保持跨平台的技术多样性
|
||||
|
||||
## Key Claims(用中文描述)
|
||||
- 原生 iOS/Android 开发必须遵循平台设计指南(Material Design、Human Interface Guidelines)
|
||||
- 移动应用必须实现离线优先架构和智能数据同步
|
||||
- 跨平台开发需在代码复用与平台原生体验之间找到平衡
|
||||
- 移动性能优化目标:冷启动 < 3 秒,内存占用 < 100MB,续航损耗 < 5%/小时
|
||||
|
||||
## Key Quotes
|
||||
> "Implemented iOS-native navigation with SwiftUI while maintaining Material Design patterns on Android" — 平台感知型开发示例
|
||||
> "Built offline-first architecture to handle poor network conditions gracefully" — 移动约束优先的设计理念
|
||||
> "Optimized app startup time to 2.1 seconds and reduced memory usage by 40%" — 性能优化的典型目标
|
||||
|
||||
## Key Concepts
|
||||
- [[Offline-First Architecture]]:离线优先架构 — 构建应用时默认以离线为基准,网络连接时进行数据同步,确保弱网环境下的用户体验
|
||||
- [[MVVM Pattern]]:Model-View-ViewModel — SwiftUI 和 Jetpack Compose 推荐的状态管理模式,ViewModel 持有 UI 状态和业务逻辑,View 负责渲染
|
||||
- [[Cross-Platform Mobile Development]]:跨平台移动开发 — 使用 React Native 或 Flutter 等框架在 iOS 和 Android 上共享代码,同时保持平台原生特性
|
||||
- [[Platform-Native UI]]:平台原生 UI — 遵循各平台设计规范(Material Design / HIG)实现符合用户预期的界面和交互
|
||||
- [[Biometric Authentication]]:生物特征认证 — 在移动应用中集成 Face ID、Touch ID 或指纹识别实现安全身份验证
|
||||
- [[Push Notification System]]:推送通知系统 — 针对不同平台(APNs/Firebase)实现精准推送,提升用户留存
|
||||
|
||||
## Key Entities
|
||||
- [[SwiftUI]]:Apple 声明式 UI 框架,用于构建现代 iOS/macOS 应用界面
|
||||
- [[Jetpack Compose]]:Google Jetpack 声明式 UI 工具包,Android 原生现代化 UI 开发
|
||||
- [[React Native]]:Facebook/Meta 开源跨平台框架,使用 JavaScript/TypeScript 构建原生移动应用
|
||||
- [[Flutter]]:Google 开源跨平台 UI 工具包,使用 Dart 语言,可编译为原生 ARM 代码
|
||||
- [[Swift]]:Apple iOS/macOS 开发语言,配合 SwiftUI 使用
|
||||
- [[Kotlin]]:Google 官方 Android 开发语言,配合 Jetpack Compose 使用
|
||||
|
||||
## Connections
|
||||
- [[agents-orchestrator]] ← orchestrates ← [[engineering-mobile-app-builder]]
|
||||
- [[engineering-mobile-app-builder]] ← shares_workflow ← [[unity-architect]](平台策略和架构决策方法论)
|
||||
- [[engineering-mobile-app-builder]] ← extends ← [[software-architect]](系统架构原则应用于移动端)
|
||||
- [[visionos-spatial-engineer]] ← related_to ← [[engineering-mobile-app-builder]](Apple 生态移动开发扩展)
|
||||
- [[xr-immersive-developer]] ← related_to ← [[engineering-mobile-app-builder]](XR 与移动平台的跨设备体验)
|
||||
|
||||
## Contradictions
|
||||
- 与 [[unity-architect]] 跨平台理念存在框架差异:
|
||||
- 冲突点:原生开发 vs 跨平台框架的优先级
|
||||
- 当前观点:Mobile App Builder 默认支持多种框架(SwiftUI、Jetpack Compose、React Native、Flutter),按需选型
|
||||
- 对方观点:Unity Architect 专注于 Unity 引擎内的跨平台方案
|
||||
- 说明:两者解决的问题域不同,Mobile App Builder 面向通用移动应用,Unity Architect 面向游戏开发,属合理分工而非矛盾
|
||||
Reference in New Issue
Block a user