nexus/wiki/concepts/Fairness-Audit.md at b40abbcd473a7093d8261e212e3d6de97c1e516a

ishenwei/nexus

Files

weishen 111bc65b7b Update nexus wiki content

2026-05-03 05:42:12 +08:00

title, type, tags, sources, last_updated

title

type

Definition

公平性审计（Fairness Audit）是 ML 模型审计中评估模型是否对不同受保护群体（protected groups）产生系统性歧视的过程。核心目标：识别和量化模型预测中基于种族、性别、年龄、宗教、国籍等受保护属性的不公平差异，确保模型符合伦理规范和监管要求。

Model QA Specialist 执行以下公平性审计步骤：

受保护属性识别：确认模型决策涉及哪些受保护特征（法律/道德/业务角度）
Baseline 指标计算：在全人群上计算 AUC/KS/Gini 作为基准
分层指标对比：在受保护群体上分别计算性能指标，量化差距
差异影响评估：DIR < 0.8 则标记为潜在歧视，需进一步调查
因果分析：区分相关关系（Correlation）与因果效应（Causation），避免虚假公平性
补救建议：Pre-processing（重采样/重加权）/ In-processing（对抗训练/约束优化）/ Post-processing（阈值调整）

公平性指标不可同时最优：Demographic Parity 与 Equalized Odds 在一般情况下不可同时满足（Impossibility Theorem）
代理变量问题：直接排除受保护属性后，模型仍可能通过代理变量（如邮编→种族）歧视
数据不平衡：受保护群体的稀缺样本可能导致统计结论不可靠
监管框架差异：欧盟 AI Act / 美国 EEOC / 巴塞尔协议对公平性要求各不相同