--- title: "Multi-Agent System Reliability" type: source tags: [] date: 2026-04-13 --- ## Source File - [[raw/AI/Multi-Agent System Reliability.md]] ## Summary - 核心主题:多智能体系统的四大可靠性架构模式 - 问题域:如何克服 LLM 的不可靠性(幻觉、逻辑谬误、上下文漂移)并构建稳健的多智能体系统 - 方法/机制:Hierarchy(层级结构)、Consensus(共识投票)、Adversarial Debate(对抗辩论)、Knock-out(淘汰制)四种架构模式 - 结论/价值:从"AI Prototype"到"Enterprise AI"的转变关键在于停止将 LLM 视为魔法聊天机器人,开始将其视为分布式系统中不可靠的组件 ## Key Claims - LLM 天生不可靠:产生幻觉、逻辑谬误、上下文漂移;将其拟人化是谬误 - 层级结构(Hierarchy):Planner(规划器)分解任务 → Worker(工作者)执行 → Validator(验证器)验证结果 - 共识(Consensus):N 个模型对同一任务独立生成答案,取多数票;3 个模型同时产生相同幻觉的概率仅为 0.8%(0.2³) - 对抗辩论(Adversarial Debate):Generator 提出方案 → Critic 攻击缺陷 → Judge 裁决,Watchdog 打破死循环 - 淘汰制(Knock-out):N 个 Agent 执行任务,Validator 淘汰最差者;类比 SRE 中服务器是"cattle"而非"pets" - 四种模式均源于人类系统的协作模式:军队(层级)、民主投票(共识)、法庭(辩论)、自然选择(淘汰) ## Key Quotes > "Stop treating LLMs like magic chatbots. Start treating them like unreliable components in a distributed system" — 核心转变 > "We don't need AI that 'cares.' We need AI that is constrained, verified, pruned, and challenged" — 需求定义 > "Don't anthropomorphize LLMs!" — 关键警告 ## Key Concepts - [[多Agent可靠性模式]]:Hierarchy(层级)、Consensus(共识)、Adversarial Debate(对抗辩论)、Knock-out(淘汰制) - [[LLM不可靠性]]:LLM 固有的幻觉、逻辑谬误和上下文漂移问题 - [[验证器模式]]:Validator 通过确定性代码(单元测试、JSON schema)或 LLM 验证输出的机制 - [[共识投票]]:N 个独立 LLM 对同一任务生成答案,取多数票降低幻觉概率 ## Key Entities - [[Alex Ewerlöf]]:资深工程师,专注于可靠性工程和弹性架构,自 2023 年专攻 LLM ## Connections - [[多Agent可靠性模式]] ← resolves ← [[LLM不可靠性]] - [[共识投票]] ← uses ← [[LLM不可靠性]] - [[验证器模式]] ← implements ← [[多Agent可靠性模式]] ## Contradictions - 无已知冲突