Sync: add design and process improvement notes

2026-04-25 19:38:47 +08:00
parent 2613a74c73
commit 8c909c9c08
21 changed files with 1553 additions and 107 deletions
--- a/wiki/overview.md
+++ b/wiki/overview.md
@@ -92,6 +92,17 @@ The wiki covers two major multi-agent frameworks: **The Agency** (agency-agents)

 **[[Project-Management-Experiment-Tracker]]**（Experiment Tracker）：实验追踪与数据驱动决策专家 Agent——The Agency 项目管理部门的实验管理专家 Agent，专注于 A/B 测试、功能实验和假设验证的科学化管理。核心职责：设计统计有效的 A/B 测试和多变量实验（默认 95% 置信度）、管理实验 Portfolio 组合（每季度 15+ 实验）、执行统计功效分析确定所需样本量、实施渐进放量与安全监控。高级能力：多臂老虎机（Multi-armed Bandits）动态流量分配、贝叶斯分析支持实时决策、因果推断技术理解实验真正效果、ML 模型 A/B 测试与预测建模。典型交付物：实验设计文档模板（假设/设计/风险评估/实施计划）、实验结果报告模板（统计结果/置信区间/业务影响/决策建议）。成功指标：95% 实验达统计显著性、70% 实验成功率、80% 成功实验实现落地。与 [[Project-Management-Studio-Producer]] 协同——Producer 基于实验数据优化 Portfolio 资源配置；与 [[Project-Management-Studio-Operations]] 存在潜在张力——实验节奏（等待统计显著性）可能与内容制作节奏冲突；与 [[Project-Management-Jira-Workflow-Steward]] 协同——实验结果通过 Jira 工作流转化为产品改进任务。属 Agency 项目管理体系中的实验验证层级，补充了从战略规划→任务分解→实验验证→流程治理的完整闭环。

+### The Agency — Testing 部门
+|The Agency 的 Testing 部门涵盖 API 测试、可访问性审计、工具评估、证据收集、结果分析、性能基准、真实性检验、工作流优化等专业测试 Agent，覆盖从功能到安全到性能的全方位质量保障。|
+
+**[[testing-api-tester]]**（API Tester）：API 测试与验证专家 Agent——The Agency Testing 部门的核心 API 质量保障专家，专注于全面的 API 功能验证、性能测试和安全审计。核心理念：**Breaks your API before your users do**——防御性测试哲学，主动发现潜在问题。核心能力：Playwright/REST Assured/k6 自动化测试框架、95%+ API 端点覆盖率目标、CI/CD 流水线集成。性能 SLA：95 百分位响应时间 < 200ms、10x 正常负载验证、错误率 < 0.1%。安全测试覆盖 OWASP API Security Top 10（认证绕过/SQL 注入/XSS/速率限制等）。与 [[specialized-model-qa]] 互补——后者测试 ML 模型质量，前者测试 API 端点行为；与 [[multi-agent-system-reliability]] 协同——系统可靠性依赖 API 质量验证。
+
+**[[testing-workflow-optimizer]]**（Workflow Optimizer）：流程优化与工作流自动化专家 Agent——The Agency Testing 部门的核心流程改进专家，基于系统思维方法论分析、优化和自动化跨业务功能的工作流。核心理念：**找到瓶颈，修复流程，其余自动化**。核心方法：四阶段工作流（现状分析与文档化→优化设计与未来状态规划→实施规划与变更管理→自动化实现与监控）+ 数据驱动决策框架（测量→验证→文档化）。方法论融合：Lean（消除浪费）/Six Sigma（DMAIC 减少变异）/Kaizen（持续改进）/统计过程控制。人本设计原则：在追求效率的同时平衡员工满意度与认知负荷，在自动化效率与人类判断创造力之间取得平衡。核心交付物：WorkflowOptimizer Python 框架（含瓶颈识别/自动化潜力评估/ROI 计算/实施路线图生成）。成功指标：40% 平均周期时间改善、60% 常规任务自动化率、75% 流程相关错误减少、90% 优化流程 6 个月内成功采纳、30% 员工满意度提升。与 [[specialized-workflow-architect]] 互补——后者负责工作流设计建模（穷举路径/状态树），前者负责工作流实施改进（量化效率收益/自动化 ROI），属于设计与执行的分层关系。与 [[product-behavioral-nudge-engine]] 在自动化 vs 人机交互上存在互补张力：Workflow Optimizer 追求最大化自动化，Nudge Engine 追求最大化员工参与，两者共同构成效率与人本的双轮驱动。
+
+**[[testing-reality-checker]]**（Reality Checker）：截图驱动型生产就绪认证 Agent——The Agency Testing 部门的最后一道防线 Agent，通过自动化截图证据截断"幻想型认证"，要求压倒性视觉证明才授予生产就绪状态。核心理念：**默认"NEEDS WORK"，以截图证据截断虚假乐观评估**。核心方法：三步强制流程（Reality Check 命令验证实际构建 → QA 交叉验证自动化证据 → 端到端截图分析用户旅程）+ 硬性失败触发器（完美评分/无证据声明/声称奢华但实为基础实现/规格未落地）。默认状态：NEEDS WORK；C+/B- 评级属正常；第一次实现通常需要 2-3 轮修订。与 [[testing-workflow-optimizer]] 存在张力：Optimizer 追求效率（目标 60% 自动化率），Reality Checker 追求真实性（要求每轮修订充分证据），在修订周期数量上可能存在分歧；与 [[testing-api-tester]] 互补——API Tester 提供后端接口测试证据，Reality Checker 要求端到端截图，两者共同构成前后端双重质量门控。与 [[Agents-Orchestrator]] 协同——作为多智能体流水线的最终质量门控。
+
+**[[testing-performance-benchmarker]]**（Performance Benchmarker）：性能测试与优化专家 Agent——The Agency Testing 部门的性能工程专家，通过系统性性能测试确保系统以 95% 置信度满足 SLA 要求。核心理念：**量化一切可量化的，用数据证明优化价值**。核心能力：负载/压力/耐力/可扩展性测试，Core Web Vitals 优化（LCP < 2.5s / FID < 100ms / CLS < 0.1），k6 性能测试框架，统计置信区间分析，容量规划与成本-性能权衡。交付物模板包含性能测试结果、瓶颈分析（数据库/应用层/基础设施/第三方服务）、Core Web Vitals 评分、ROI 分析和优化建议。成功指标：95% 系统持续满足性能 SLA，Core Web Vitals 达到"良好"评级（90th percentile），关键用户体验指标改善 25%，支持 10x 当前负载。与 [[testing-reality-checker]] 互补——Reality Checker 验证视觉真实性，Performance Benchmarker 验证性能指标，两者共同构成质量保障的双重维度；与 [[testing-api-tester]] 协同——API Tester 提供 API 层面的性能 SLA（p95 < 200ms），Performance Benchmarker 提供系统整体性能视图。
+
 ### The Agency — Paid Media 部门
 The Agency 的 Paid Media 部门专注于企业级付费媒体策略与运营，涵盖 Google Ads、Microsoft Advertising、Amazon Ads 三大核心平台。