Update nexus wiki content

2026-05-03 05:42:06 +08:00
parent 90f3811b83
commit 111bc65b7b
707 changed files with 32306 additions and 7289 deletions
--- a/wiki/sources/testing-evidence-collector.md
+++ b/wiki/sources/testing-evidence-collector.md
@@ -1,53 +1,47 @@
 ---
-title: "Testing Evidence Collector Agent Personality"
+title: "Testing Evidence Collector"
 type: source
 tags: []
-date: 2026-04-25
+date: 2026-04-30
 ---

 ## Source File
- [[raw/Agent/agency-agents/testing/testing-evidence-collector.md]]
+- [[Agent/agency-agents/testing/testing-evidence-collector.md]]

 ## Summary（用中文描述）
- 核心主题：EvidenceQA —— 一个以截图为核心证据的 QA Agent 个性化角色定义
- 问题域：如何对 AI Agent 生成的前端实现进行严格的质量评估，避免"幻想式报告"（Fantasy Reporting）
- 方法/机制：通过 Playwright 自动化截图 + 视觉对比 + 强制默认找问题（至少 3-5 个）来实现真实性检验
- 结论/价值：QA 质量评估必须基于视觉证据，零问题报告是红色警报，必须强制提供截图
+- 核心主题：EvidenceQA 是一个以视觉证据为核心的 QA Agent 人格，专注于通过截图和实际测试结果来验证功能实现。
+- 问题域：AI Agent 开发中的质量保证流程 —— 如何防止"幻想式报告"（fantasy reporting）通过验收。
+- 方法/机制：通过 Playwright 自动化截图采集 → 截图视觉分析 → 规格对比 → 生成有据可查的 QA 报告。
+- 结论/价值：为 AI Agent 开发流程引入严格的视觉证据验证机制，确保"所见即所得"，避免功能声称与实际实现不符。

 ## Key Claims（用中文描述）
- EvidenceQA 相信"截图不会撒谎"——视觉证据是唯一可靠的真理
- 首次实现总是存在至少 3-5 个问题，"零问题"是红色警报
- 每个声明都需要截图证据支撑，无证据的声明视为"幻想"
- luxury/premium 等描述词无截图支撑即为违规
- 质量评级默认 FAILED，除非压倒性证据证明通过
+- 视觉证据是唯一可信的真相：无法在截图中看到的功能实现，等同于不存在。
+- 默认应发现 3-5+ 个问题：首次实现总是存在问题的，"零问题"报告是危险信号。
+- 每个断言都需要截图佐证：口头或文字声称必须有对应的截图证据支撑。
+- 诚实评估质量等级：Basic / Good / Excellent，拒绝虚假的 A+ / 98 分等完美评分。
+- 生产就绪状态默认失败：除非有压倒性证据，否则默认判定为 FAILED。

 ## Key Quotes
-> "Screenshots Don't Lie" — Visual evidence is the only truth that matters
-> "Default to Finding Issues" — First implementations ALWAYS have 3-5+ issues minimum
-> "Zero issues found" is a red flag - look harder
-> "Your job is to be the reality check that prevents broken websites from being approved"
+> "Screenshots Don't Lie" — "If you can't see it working in a screenshot, it doesn't work"
+> "Default to Finding Issues" — "First implementations ALWAYS have 3-5+ issues minimum"
+> "Prove Everything" — "Every claim needs screenshot evidence"

 ## Key Concepts
- [[Visual Evidence]]：QA 评估的唯一可靠依据，通过 Playwright 自动化截图捕获
- [[Fantasy Reporting]]：指无视觉证据支撑的声称，如"零问题"、"Luxury 级别"等
- [[Reality Check Commands]]：强制性初始检查命令，包括 Playwright 截图、文件检查、grep 特征搜索
- [[Specification Compliance]]：将实际截图与原始规范逐字对比，不添加规范外的额外要求
- [[Accordion Testing Protocol]]：通过 before/after 截图对比验证手风琴组件的展开/折叠功能
- [[Form Testing Protocol]]：验证表单提交、校验、错误信息展示的完整性
- [[Mobile Responsive Testing]]：在 desktop/tablet/mobile 三种分辨率下验证布局和导航
+- [[EvidenceQA]]：截图驱动的 QA Agent 人格，核心原则是"截图不说谎"
+- [[Playwright自动化截图]]：使用 `./qa-playwright-capture.sh` 脚本自动采集多设备、多状态的截图证据
+- [[FantasyReporting]]：指 AI Agent 声称"零问题"或"完美评分"但无视觉证据支撑的报告行为
+- [[规格一致性验证]]：将实际截图与原始规格说明进行逐条对比，记录匹配/不匹配项
+- [[QA报告模板]]：结构化的证据报告格式，包含 Reality Check → Visual Evidence → Issues Found → Honest Assessment

 ## Key Entities
- [[EvidenceQA]]：截图驱动型 QA Agent，以视觉证据为唯一真理，默认发现 3-5+ 问题
- [[Playwright]]：自动化截图工具（qa-playwright-capture.sh），提供 comprehensive screenshots 和 test-results.json
+- [[EvidenceQA]]：QA Agent 人格名，持久的视觉证据驱动型质量保证专员

 ## Connections
- [[Testing Reality Checker]] ← related_to ← [[Testing Evidence Collector]]
- [[Testing Test Results Analyzer]] ← related_to ← [[Testing Evidence Collector]]
- [[Testing Performance Benchmarker]] ← related_to ← [[Testing Evidence Collector]]
+- [[TestingRealityChecker]] ← depends_on ← [[TestingEvidenceCollector]]（依赖截图证据进行现实检查）
+- [[TestingTestResultsAnalyzer]] ← depends_on ← [[TestingEvidenceCollector]]（依赖截图 JSON 数据进行性能分析）
+- [[TestingPerformanceBenchmarker]] ← depends_on ← [[TestingEvidenceCollector]]（依赖截图和性能数据）
+- [[Playwright]] ← used_by ← [[TestingEvidenceCollector]]（核心截图采集工具）

 ## Contradictions
- 与声称"零问题"的报告冲突：
-  - 冲突点：首次实现的问题数量
-  - 当前观点：默认发现 3-5+ 问题，"零问题"是红色警报
-  - 对方观点：声称"零问题"即通过
-```
+- 无冲突内容
+