---
title: "多智能体系统可靠性"
type: source
tags: [multi-agent, reliability, architecture]
sources: [raw/AI/Multi-Agent System Reliability.md]
last_updated: 2026-04-18
---

## Source File
- [[raw/AI/Multi-Agent System Reliability.md]]

## Summary
- 核心主题：多智能体系统的可靠性架构模式
- 问题域：LLM 不可靠性导致的系统级错误传播
- 方法/机制：层级结构、共识投票、对抗式辩论、淘汰制四种架构模式
- 结论/价值：将 LLM 视为不可靠组件，通过架构设计强制正确性而非依赖模型"小心谨慎"

## Key Claims
- LLM 本质不可靠（幻觉、逻辑谬误、上下文漂移），多智能体拓扑会将错误传播到无法使用的程度
- 层级结构通过依赖图强制 Worker 协作，验证器捕获作弊
- 共识投票中 3 个模型同时幻觉相同谎言的概率仅为 0.8%（20%³）
- 对抗式辩论模拟人类"恐惧"机制，通过外部批评者纠正模型"好好先生"倾向
- 淘汰制将 LLM 视为"牲畜"而非"宠物"，失败即替换而非修复

## Key Quotes
> "We don't need AI that 'cares.' We need AI that is constrained, verified, pruned, and challenged." — Alex Ewerlöf

> "Don't anthropomorphize LLMs! Find a way to piggy back on their human-corpus training while being aware of their non-biological differences." — Alex Ewerlöf

## Key Concepts
- [[多智能体系统可靠性]]：通过架构模式提升 LLM 多智能体系统可靠性的方法论
- [[层级结构 (Hierarchy)]]：Planner 分解任务 → Worker 执行 → Validator 验证的三层架构
- [[共识投票 (Consensus)]]：多数票机制抵消单个模型的随机噪声
- [[对抗式辩论 (Adversarial Debate)]]：生成器+批评者+评委的三角制衡结构
- [[淘汰制 (Knock-out)]]：适者生存的遗传算法式选择机制
- [[可靠性工程]]：将 LLM 视为分布式系统中不可靠组件的工程思维

## Key Entities
- [[Alex Ewerlöf]]：作者，27年经验的资深工程师，KTH 系统工程硕士，专注可靠性工程和弹性架构
- [[KTH]]：瑞典皇家理工学院（KTH Royal Institute of Technology）

## Connections
- [[多智能体系统可靠性]] ← extends ← [[Multi-Agent-Team]]
- [[层级结构 (Hierarchy)]] ← depends_on ← [[依赖图]]
- [[共识投票 (Consensus)]] ← uses ← [[复合 SLO]]
- [[淘汰制 (Knock-out)]] ← implements ← [[遗传算法]]
- [[对抗式辩论 (Adversarial Debate)]] ← avoids ← [[群体思维]]
- [[可靠性工程]] → applies_to → [[SRE]]

## Contradictions
- 与 [[Multi-Agent-Team]] 视角不同：Multi-Agent-Team 强调 Agent 个性和协作流程，本文强调将 LLM 视为不可靠组件的工程视角
- 与 [[Agent Chain]] 区别：Agent Chain 是简单的串联模式，本文强调验证和反馈机制