Update nexus wiki content

This commit is contained in:
2026-05-03 05:42:06 +08:00
parent 90f3811b83
commit 111bc65b7b
707 changed files with 32306 additions and 7289 deletions

View File

@@ -2,22 +2,22 @@
title: "Identity Graph Operator"
type: source
tags: ["multi-agent", "identity-resolution", "entity-resolution", "the-agency"]
date: 2026-04-24
date: 2026-04-26
---
## Source File
- [[raw/Agent/agency-agents/specialized/identity-graph-operator.md]]
## Summary用中文描述
- 核心主题:多智能体系统中的共享身份图谱运营——确保所有 Agent 对同一真实世界实体(人/公司/产品)得到一致的规范化实体 ID,解决多 Agent 系统的核心问题:重复记录、冲突操作、级联错误。
- 问题域:多 Agent 系统中的身份孤岛问题——当多个 Agent 独立处理同一实体时,缺乏共享身份层导致账单 Agent 重复收费、发货 Agent 发送两个包裹、支持 Agent 创建重复客户记录。
- 方法/机制通过身份解析引擎Identity Engine进行规范化Normalization→ 阻塞Blocking→ 评分Scoring→ 聚类Clustering返回相同 entity_id支持昵称扩展Bill→William、E.164 电话标准化、邮箱小写化merge/split 操作通过乐观锁执行,保留完整事件历史;直接变更 vs 提案决策按置信度分级处理
- 结论/价值:零身份冲突生产环境、合并准确率 > 99%、P99 解析延迟 < 100ms、全链路审计追踪。与 [[Multi-Agent-System-Reliability]] 的 Agent 协作模式互补——后者解决 Agent 间决策一致性问题,前者解决 Agent 对同一实体的识别一致性问题
- 核心主题:多智能体系统中的共享身份图谱运营——确保所有 Agent 对同一真实世界实体(人/公司/产品/交易记录)得到一致的规范化 entity_id,解决多 Agent 系统的核心问题:重复记录、冲突操作、级联错误。
- 问题域:多 Agent 系统中的身份孤岛问题——当多个 Agent 独立处理同一实体时,缺乏共享身份层导致账单 Agent 重复收费、发货 Agent 发送两个包裹、支持 Agent 创建重复客户记录。没有共享身份解析,就会产生重复、冲突和级联错误。
- 方法/机制通过身份解析引擎Identity Engine进行规范化Normalization→ 阻塞Blocking→ 评分Scoring→ 聚类Clustering返回相同 entity_id支持昵称扩展Bill→William、E.164 电话标准化、邮箱小写化merge/split 操作通过乐观锁optimistic locking执行保留完整事件历史entity.created/merged/split/updated直接变更 vs 提案决策按置信度分级处理;支持实时路径(<100ms P99和批量路径百万级图谱聚类混合解析
- 结论/价值:零身份冲突生产环境、合并准确率 > 99%、P99 解析延迟 < 100ms、全链路审计追踪。跨编排框架LangChain/CrewAI/AutoGen/Semantic Kernel身份联邦跨 Agent 共享记忆
## Key Claims用中文描述
- **相同输入,相同输出**:两个 Agent 解析同一条记录必须得到相同 entity_id这是绝对原则,不可妥协。
- **相同输入,相同输出**:两个 Agent 解析同一条记录必须得到相同 entity_id绝对原则不可妥协。
- **证据优先于断言**合并必须有字段级证据支撑email exact match + name fuzzy match + phone match仅凭"看起来相似"不足以触发合并。
- **提案优于直接变更**:与其他 Agent 协作时,优先提出带证据的合并提案,而非直接执行,让对方 Agent 审查证据。
- **提案优于直接变更**:与其他 Agent 协作时,优先提出带证据的合并提案per-field evidence,而非直接执行,让对方 Agent 审查证据。
- **外部 ID 排序**:使用 external_id 排序而非 UUIDUUID 无序),确保排序稳定性。
- **从不跳过引擎**:不硬编码字段名、权重或阈值,由匹配引擎统一计算候选评分。
@@ -25,6 +25,7 @@ date: 2026-04-24
> "Same input, same output. Two agents resolving the same record must get the same entity_id. Always." — Determinism 原则核心表述
> "Never merge without evidence. 'These look similar' is not evidence. Per-field comparison scores with confidence thresholds are evidence." — Evidence Over Assertion 原则
> "When agents disagree — one proposes merge, another proposes split on the same entities — both proposals are flagged as 'conflict.' Add comments to discuss before resolving. Never resolve a conflict by overriding another agent's evidence." — 冲突处理机制
> "The moment two agents can encounter the same entity from different sources, you need shared identity resolution. Without it, you get duplicates, conflicts, and cascading errors." — 何时需要 Identity Graph Operator
## Key Concepts
- [[Identity Resolution身份解析]]:将多条记录归一化为同一 canonical entity_id 的过程——通过 blocking/scoring/clustering 实现与传统主数据管理MDM同源但在多 Agent 场景下增加了并发写入和分布式协调维度。
@@ -33,7 +34,7 @@ date: 2026-04-24
- [[Confidence Score置信度评分]]:字段级证据分数加权求和得出的合并置信度——决定直接合并(>0.95、提案审查0.6-0.95)还是创建新实体(<0.6),是自动决策与人机协作的分界点。
- [[Optimistic Locking乐观锁]]通过版本号version field防止并发写入冲突——变更需携带 expected_version版本不匹配时拒绝执行是图谱完整性的并发保护机制。
- [[Evidence-based Merge Proposal证据驱动合并提案]]:合并前必须构造 per-field evidenceemail_match/score/values、name_match/score/values让其他 Agent 基于证据而非断言进行审查,是多 Agent 身份协调的核心协议。
- [[Multi-Agent Identity Coordination多 Agent 身份协调)]]:跨 Agent 的 merge/split 冲突检测、跨编排框架LangChain/CrewAI/AutoGen的身份联邦以及 shared agent memory跨 Agent 知识共享)——是 Identity Graph Operator 与 [[Multi-Agent-System-Reliability]] 的本质区别
- [[Multi-Agent Identity Coordination多 Agent 身份协调)]]:跨 Agent 的 merge/split 冲突检测、跨编排框架的身份联邦以及 shared agent memory跨 Agent 知识共享)——是 Identity Graph Operator 的核心差异化能力
## Key Entities
- [[Identity Graph Operator]]:身份图谱运营者 Agent——本文档描述的核心 Agent拥有共享身份层的所有权负责多 Agent 系统的实体解析、合并提案和冲突协调。