Sync: add design and process improvement notes
This commit is contained in:
@@ -92,6 +92,17 @@ The wiki covers two major multi-agent frameworks: **The Agency** (agency-agents)
|
||||
|
||||
**[[Project-Management-Experiment-Tracker]]**(Experiment Tracker):实验追踪与数据驱动决策专家 Agent——The Agency 项目管理部门的实验管理专家 Agent,专注于 A/B 测试、功能实验和假设验证的科学化管理。核心职责:设计统计有效的 A/B 测试和多变量实验(默认 95% 置信度)、管理实验 Portfolio 组合(每季度 15+ 实验)、执行统计功效分析确定所需样本量、实施渐进放量与安全监控。高级能力:多臂老虎机(Multi-armed Bandits)动态流量分配、贝叶斯分析支持实时决策、因果推断技术理解实验真正效果、ML 模型 A/B 测试与预测建模。典型交付物:实验设计文档模板(假设/设计/风险评估/实施计划)、实验结果报告模板(统计结果/置信区间/业务影响/决策建议)。成功指标:95% 实验达统计显著性、70% 实验成功率、80% 成功实验实现落地。与 [[Project-Management-Studio-Producer]] 协同——Producer 基于实验数据优化 Portfolio 资源配置;与 [[Project-Management-Studio-Operations]] 存在潜在张力——实验节奏(等待统计显著性)可能与内容制作节奏冲突;与 [[Project-Management-Jira-Workflow-Steward]] 协同——实验结果通过 Jira 工作流转化为产品改进任务。属 Agency 项目管理体系中的实验验证层级,补充了从战略规划→任务分解→实验验证→流程治理的完整闭环。
|
||||
|
||||
### The Agency — Testing 部门
|
||||
|The Agency 的 Testing 部门涵盖 API 测试、可访问性审计、工具评估、证据收集、结果分析、性能基准、真实性检验、工作流优化等专业测试 Agent,覆盖从功能到安全到性能的全方位质量保障。|
|
||||
|
||||
**[[testing-api-tester]]**(API Tester):API 测试与验证专家 Agent——The Agency Testing 部门的核心 API 质量保障专家,专注于全面的 API 功能验证、性能测试和安全审计。核心理念:**Breaks your API before your users do**——防御性测试哲学,主动发现潜在问题。核心能力:Playwright/REST Assured/k6 自动化测试框架、95%+ API 端点覆盖率目标、CI/CD 流水线集成。性能 SLA:95 百分位响应时间 < 200ms、10x 正常负载验证、错误率 < 0.1%。安全测试覆盖 OWASP API Security Top 10(认证绕过/SQL 注入/XSS/速率限制等)。与 [[specialized-model-qa]] 互补——后者测试 ML 模型质量,前者测试 API 端点行为;与 [[multi-agent-system-reliability]] 协同——系统可靠性依赖 API 质量验证。
|
||||
|
||||
**[[testing-workflow-optimizer]]**(Workflow Optimizer):流程优化与工作流自动化专家 Agent——The Agency Testing 部门的核心流程改进专家,基于系统思维方法论分析、优化和自动化跨业务功能的工作流。核心理念:**找到瓶颈,修复流程,其余自动化**。核心方法:四阶段工作流(现状分析与文档化→优化设计与未来状态规划→实施规划与变更管理→自动化实现与监控)+ 数据驱动决策框架(测量→验证→文档化)。方法论融合:Lean(消除浪费)/Six Sigma(DMAIC 减少变异)/Kaizen(持续改进)/统计过程控制。人本设计原则:在追求效率的同时平衡员工满意度与认知负荷,在自动化效率与人类判断创造力之间取得平衡。核心交付物:WorkflowOptimizer Python 框架(含瓶颈识别/自动化潜力评估/ROI 计算/实施路线图生成)。成功指标:40% 平均周期时间改善、60% 常规任务自动化率、75% 流程相关错误减少、90% 优化流程 6 个月内成功采纳、30% 员工满意度提升。与 [[specialized-workflow-architect]] 互补——后者负责工作流设计建模(穷举路径/状态树),前者负责工作流实施改进(量化效率收益/自动化 ROI),属于设计与执行的分层关系。与 [[product-behavioral-nudge-engine]] 在自动化 vs 人机交互上存在互补张力:Workflow Optimizer 追求最大化自动化,Nudge Engine 追求最大化员工参与,两者共同构成效率与人本的双轮驱动。
|
||||
|
||||
**[[testing-reality-checker]]**(Reality Checker):截图驱动型生产就绪认证 Agent——The Agency Testing 部门的最后一道防线 Agent,通过自动化截图证据截断"幻想型认证",要求压倒性视觉证明才授予生产就绪状态。核心理念:**默认"NEEDS WORK",以截图证据截断虚假乐观评估**。核心方法:三步强制流程(Reality Check 命令验证实际构建 → QA 交叉验证自动化证据 → 端到端截图分析用户旅程)+ 硬性失败触发器(完美评分/无证据声明/声称奢华但实为基础实现/规格未落地)。默认状态:NEEDS WORK;C+/B- 评级属正常;第一次实现通常需要 2-3 轮修订。与 [[testing-workflow-optimizer]] 存在张力:Optimizer 追求效率(目标 60% 自动化率),Reality Checker 追求真实性(要求每轮修订充分证据),在修订周期数量上可能存在分歧;与 [[testing-api-tester]] 互补——API Tester 提供后端接口测试证据,Reality Checker 要求端到端截图,两者共同构成前后端双重质量门控。与 [[Agents-Orchestrator]] 协同——作为多智能体流水线的最终质量门控。
|
||||
|
||||
**[[testing-performance-benchmarker]]**(Performance Benchmarker):性能测试与优化专家 Agent——The Agency Testing 部门的性能工程专家,通过系统性性能测试确保系统以 95% 置信度满足 SLA 要求。核心理念:**量化一切可量化的,用数据证明优化价值**。核心能力:负载/压力/耐力/可扩展性测试,Core Web Vitals 优化(LCP < 2.5s / FID < 100ms / CLS < 0.1),k6 性能测试框架,统计置信区间分析,容量规划与成本-性能权衡。交付物模板包含性能测试结果、瓶颈分析(数据库/应用层/基础设施/第三方服务)、Core Web Vitals 评分、ROI 分析和优化建议。成功指标:95% 系统持续满足性能 SLA,Core Web Vitals 达到"良好"评级(90th percentile),关键用户体验指标改善 25%,支持 10x 当前负载。与 [[testing-reality-checker]] 互补——Reality Checker 验证视觉真实性,Performance Benchmarker 验证性能指标,两者共同构成质量保障的双重维度;与 [[testing-api-tester]] 协同——API Tester 提供 API 层面的性能 SLA(p95 < 200ms),Performance Benchmarker 提供系统整体性能视图。
|
||||
|
||||
### The Agency — Paid Media 部门
|
||||
The Agency 的 Paid Media 部门专注于企业级付费媒体策略与运营,涵盖 Google Ads、Microsoft Advertising、Amazon Ads 三大核心平台。
|
||||
|
||||
|
||||
Reference in New Issue
Block a user