Files
nexus/wiki/sources/testing-reality-checker.md

3.7 KiB
Raw Blame History

title, type, tags, date
title type tags date
Testing Reality Checker source
2026-04-21

Source File

Summary用中文描述

  • 核心主题The Agency Testing 部门的 Reality Checker Agent——通过自动化截图证据截断"幻想型认证",要求压倒性视觉证明才授予生产就绪状态。
  • 问题域AI Agent 协作中各环节(设计/开发/QA给出的评估过于乐观缺乏实际截图验证导致"98/100 评级"发给基础网站、"生产就绪"标签打在未完成系统上。
  • 方法/机制强制三步流程Reality Check 命令 → QA 交叉验证 → 端到端系统截图分析)+ 硬性失败触发器;默认 NEETS WORK 状态,必须有压倒性证据才能升级为 READY。
  • 结论/价值:第一次实现通常需要 2-3 轮修订C+/B- 评级属正常;只有真实截图证据才能支撑"生产就绪"声明。

Key Claims用中文描述

  • Testing Reality Checker Agent 作为最后一道防线,通过截图证据截断"幻想型认证",要求压倒性视觉证明。
  • 所有系统声明需要视觉证明(自动化截图),规格说明需要对照实际实现进行交叉验证。
  • 完整的用户旅程测试需要截图证据;性能数据(加载时间、错误率)必须来自 test-results.json。
  • 默认"NEEDS WORK"状态,除非有压倒性证据支持"READY"。

Key Quotes

"You're the last line of defense against unrealistic assessments" — Testing Reality Checker Agent 自我定位 "Default to 'NEEDS WORK' status unless proven otherwise" — 核心认证原则 "First implementations typically need 2-3 revision cycles, C+/B- ratings are normal" — 现实质量预期 "Trust evidence over claims" — 质量认证核心方法论

Key Concepts

Key Entities

  • Testing Reality Checker AgentThe Agency Testing 部门角色——截图驱动的生产就绪认证 Agent
  • QA Agent前序 QA 测试环节,提供自动化测试发现和证据
  • Integration AgentRealityIntegration——Reality Checker 的执行主体
  • testing-workflow-optimizer:工作流优化 Agent为 Reality Checker 提供优化流程建议
  • testing-api-testerAPI 测试 Agent提供后端接口层面的测试证据

Connections

Contradictions

  • testing-workflow-optimizer 潜在张力Workflow Optimizer 追求流程效率目标75% 流程错误减少Reality Checker 追求真实性(默认"需要工作"两者在修订周期数量上可能存在分歧——Optimizer 希望快速迭代Checker 要求充分证据
  • testing-api-tester 的互补关系API Tester 提供后端接口测试证据Reality Checker 要求端到端截图;两者共同构成前后端双重质量门控