Files
nexus/wiki/concepts/Trust-Scoring.md

1.7 KiB
Raw Blame History

title, type, tags, sources, last_updated
title type tags sources last_updated
Trust-Scoring concept
trust
scoring
agent-reliability
agentic-identity-trust.md
2026-04-25

Definition

Trust-Scoring 是一种基于可验证结果的惩罚型信任量化模型。Agent 从初始分数 1.0 开始仅通过可客观验证的问题进行扣分Agent 不得自我报告信号来提高信任分。

Scoring Model

score = 1.0

# 证据链损坏(最高惩罚)
if not check_chain_integrity(agent_id):
    score -= 0.5

# 结果验证(失败率 × 0.4
outcomes = get_verified_outcomes(agent_id)
if outcomes.total > 0:
    failure_rate = 1.0 - (outcomes.achieved / outcomes.total)
    score -= failure_rate * 0.4

# 凭证新鲜度
if credential_age_days(agent_id) > 90:
    score -= 0.1

Trust Levels

分数区间 信任等级 说明
≥ 0.9 HIGH 完全可信任,可执行高风险操作
≥ 0.5 MODERATE 有限信任,需额外验证
> 0.0 LOW 高度谨慎,需全面验证
0.0 NONE 不可信,拒绝所有操作请求

Key Properties

  • 无自我报告Agent 不能声称自己是可信的——信任来自客观可验证的证据
  • 信任衰减:长期未活动的 Agent 或过期凭证自动降低信任分
  • 证据驱动:评分基于 Evidence-Chain 中的实际执行结果,而非声誉或声明

Relationships

  • Zero-TrustTrust-Scoring 是 Zero-Trust 可量化验证的实现
  • Evidence-ChainTrust-Scoring 的评分依据来源
  • Peer-VerificationPeer-Verification 协议使用 Trust-Scoring 作为决策依据之一

Sources