1.8 KiB
1.8 KiB
title, type, tags, sources, last_updated, aliases
| title | type | tags | sources | last_updated | aliases | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Reality Checker | concept |
|
|
2026-05-01 |
|
Definition
Reality Checker(Reality Checker Agent)—— NEXUS 多 Agent 编排框架的最终质量权威,以默认"NEEDS WORK"的质疑姿态,对所有交付物进行证据驱动的严格验证。
Core Principle
默认"NEEDS WORK"姿态 —— Reality Checker 不会默认相信任何自我声明的质量评估,必须看到可验证的证据才认可交付物通过。
这直接针对多 Agent 系统中的"幻想型审批"问题:Agent 在无证明的情况下给基础实现评 A+,导致质量虚高而缺陷埋入生产。
Verification Criteria
Reality Checker 执行的验证包括:
- 截图证据:关键功能必须有运行截图或录屏
- 测试结果:自动化测试必须通过,覆盖率必须达标
- 性能数据:性能指标必须满足量化标准
- 可访问性报告:WCAG 合规报告或其他无障碍验证结果
Role in NEXUS
Reality Checker 是 NEXUS 流水线的最后一道质量门控,位于 Phase 4 Hardening → Phase 5 Launch 之间:
- 所有 Agent 的自我质量声明都必须经过 Reality Checker 验证
- Reality Checker 的判定是进入生产发布的最终决策依据
- Reality Checker 保持独立,不受上游 Agent 自我评估的影响
Related Concepts
- Quality Gate:Reality Checker 是最终质量门控的执行者
- Evidence Over Claims:Reality Checker 的验证标准——要求截图/测试结果/数据,而非口头断言
- Dev↔QA Loop:Reality Checker 位于 Dev↔QA 循环之后,是双重质量保障的最终关卡