title, type, tags, sources, last_updated
| title |
type |
tags |
sources |
last_updated |
| Confidence Score |
concept |
| identity-resolution |
| decision-making |
| threshold |
| multi-agent |
|
|
2026-04-25 |
Confidence Score(置信度评分)
Definition
身份解析决策的核心度量——综合所有字段级匹配证据,通过加权求和得出的合并置信度。是决定"自动合并 / 提案审查 / 创建新实体"三类决策的分界指标。
Calculation
其中 score_i 是字段级 fuzzy/exact match 分数(0–1),weight_i 是字段可靠性权重。
示例(来自 Identity Graph Operator 源码)
| 字段 |
记录A值 |
记录B值 |
Normalizer |
Comparator |
Score |
Weight |
| email |
wsmith@acme.com |
wsmith@acme.com |
email |
exact |
1.0 |
高 |
| last_name |
Smith |
Smith |
name |
exact |
1.0 |
高 |
| first_name |
William |
Bill |
name |
nickname |
0.82 |
中 |
| phone |
+155****0142 |
+155****0142 |
phone |
exact |
1.0 |
高 |
综合置信度 = 1.0×0.3 + 1.0×0.3 + 0.82×0.2 + 1.0×0.2 ≈ 0.96
Decision Thresholds
Field Reliability Weights
| 字段 |
权重 |
原因 |
| Email |
高 |
几乎唯一,变更需主动操作 |
| Phone |
高 |
需验证,变更成本高 |
| Name |
中 |
常见同名不同人,需结合其他字段 |
| Address |
低 |
常见地址变更(搬家) |
Why Thresholds Matter
- 防止假阳性(False Merge):将两个不同人(如同名"John Smith")错误合并——高阈值 + 字段级证据防止
- 防止假阴性(Missed Match):将同一人(如"Bill Smith"/"William Smith")遗漏为不同实体——中等阈值触发提案审查而非直接拒绝
- 可解释性:per-field evidence 使决策可被其他 Agent 和人类审计