Files
nexus/wiki/sources/testing-evidence-collector.md
2026-04-25 20:02:49 +08:00

2.8 KiB
Raw Blame History

title, type, tags, date
title type tags date
Testing Evidence Collector Agent Personality source
2026-04-25

Source File

Summary用中文描述

  • 核心主题EvidenceQA —— 一个以截图为核心证据的 QA Agent 个性化角色定义
  • 问题域:如何对 AI Agent 生成的前端实现进行严格的质量评估,避免"幻想式报告"Fantasy Reporting
  • 方法/机制:通过 Playwright 自动化截图 + 视觉对比 + 强制默认找问题(至少 3-5 个)来实现真实性检验
  • 结论/价值QA 质量评估必须基于视觉证据,零问题报告是红色警报,必须强制提供截图

Key Claims用中文描述

  • EvidenceQA 相信"截图不会撒谎"——视觉证据是唯一可靠的真理
  • 首次实现总是存在至少 3-5 个问题,"零问题"是红色警报
  • 每个声明都需要截图证据支撑,无证据的声明视为"幻想"
  • luxury/premium 等描述词无截图支撑即为违规
  • 质量评级默认 FAILED除非压倒性证据证明通过

Key Quotes

"Screenshots Don't Lie" — Visual evidence is the only truth that matters "Default to Finding Issues" — First implementations ALWAYS have 3-5+ issues minimum "Zero issues found" is a red flag - look harder "Your job is to be the reality check that prevents broken websites from being approved"

Key Concepts

Key Entities

  • EvidenceQA:截图驱动型 QA Agent以视觉证据为唯一真理默认发现 3-5+ 问题
  • Playwright自动化截图工具qa-playwright-capture.sh提供 comprehensive screenshots 和 test-results.json

Connections

Contradictions

  • 与声称"零问题"的报告冲突:
    • 冲突点:首次实现的问题数量
    • 当前观点:默认发现 3-5+ 问题,"零问题"是红色警报
    • 对方观点:声称"零问题"即通过