feat(wiki): complete all remaining 85 raw files ingestion (auto-script)
This commit is contained in:
@@ -1,7 +1,7 @@
|
||||
---
|
||||
title: "Multi-Agent System Reliability"
|
||||
type: source
|
||||
tags: []
|
||||
tags: [multi-agent, reliability, architecture]
|
||||
date: 2026-04-13
|
||||
---
|
||||
|
||||
@@ -9,37 +9,38 @@ date: 2026-04-13
|
||||
- [[raw/AI/Multi-Agent System Reliability.md]]
|
||||
|
||||
## Summary
|
||||
- 核心主题:多智能体系统的四大可靠性架构模式
|
||||
- 问题域:如何克服 LLM 的不可靠性(幻觉、逻辑谬误、上下文漂移)并构建稳健的多智能体系统
|
||||
- 方法/机制:Hierarchy(层级结构)、Consensus(共识投票)、Adversarial Debate(对抗辩论)、Knock-out(淘汰制)四种架构模式
|
||||
- 结论/价值:从"AI Prototype"到"Enterprise AI"的转变关键在于停止将 LLM 视为魔法聊天机器人,开始将其视为分布式系统中不可靠的组件
|
||||
- 核心主题:提高多智能体系统可靠性的4种架构模式
|
||||
- 问题域:LLM的随机性、幻觉、上下文漂移导致多Agent系统可靠性下降
|
||||
- 方法/机制:Hierarchy(规划-执行-验证)、Consensus(投票)、Adversarial Debate(对抗辩论)、Knock-out(淘汰制)
|
||||
- 结论/价值:停止要求模型"小心",开始强制模型"正确"——将LLM视为不可靠组件而非智能体
|
||||
|
||||
## Key Claims
|
||||
- LLM 天生不可靠:产生幻觉、逻辑谬误、上下文漂移;将其拟人化是谬误
|
||||
- 层级结构(Hierarchy):Planner(规划器)分解任务 → Worker(工作者)执行 → Validator(验证器)验证结果
|
||||
- 共识(Consensus):N 个模型对同一任务独立生成答案,取多数票;3 个模型同时产生相同幻觉的概率仅为 0.8%(0.2³)
|
||||
- 对抗辩论(Adversarial Debate):Generator 提出方案 → Critic 攻击缺陷 → Judge 裁决,Watchdog 打破死循环
|
||||
- 淘汰制(Knock-out):N 个 Agent 执行任务,Validator 淘汰最差者;类比 SRE 中服务器是"cattle"而非"pets"
|
||||
- 四种模式均源于人类系统的协作模式:军队(层级)、民主投票(共识)、法庭(辩论)、自然选择(淘汰)
|
||||
- LLMs是随机性的,单一答案只是概率分布
|
||||
- 3个模型同时出现相同幻觉的概率为0.8%(0.2³)
|
||||
- 4种模式:Hierarchy(规划→执行→验证)、Consensus(多数投票)、Adversarial(生成器vs批评者)、Knock-out(最差者淘汰)
|
||||
- 不要拟人化LLM——LLM不会死亡或挨饿,无法真正受到威胁
|
||||
|
||||
## Key Quotes
|
||||
> "Stop treating LLMs like magic chatbots. Start treating them like unreliable components in a distributed system" — 核心转变
|
||||
> "We don't need AI that 'cares.' We need AI that is constrained, verified, pruned, and challenged" — 需求定义
|
||||
> "Don't anthropomorphize LLMs!" — 关键警告
|
||||
> "Don't anthropomorphize LLMs! Find a way to piggy back on their human-corpus training while being aware of their non-biological differences."
|
||||
> "We don't need AI that 'cares.' We need AI that is constrained, verified, pruned, and challenged."
|
||||
|
||||
## Key Concepts
|
||||
- [[多Agent可靠性模式]]:Hierarchy(层级)、Consensus(共识)、Adversarial Debate(对抗辩论)、Knock-out(淘汰制)
|
||||
- [[LLM不可靠性]]:LLM 固有的幻觉、逻辑谬误和上下文漂移问题
|
||||
- [[验证器模式]]:Validator 通过确定性代码(单元测试、JSON schema)或 LLM 验证输出的机制
|
||||
- [[共识投票]]:N 个独立 LLM 对同一任务生成答案,取多数票降低幻觉概率
|
||||
- [[多Agent可靠性模式]]:Hierarchy、Consensus、Adversarial Debate、Knock-out四大架构
|
||||
- [[共识投票]]:利用多数投票抵消单一模型的随机噪声
|
||||
- [[对抗式辩论]]:生成器提出方案,批评者攻击,裁判评判
|
||||
- [[淘汰制]]:最差Agent被淘汰,适者生存
|
||||
- [[层级结构]]:规划器分配任务,工作器执行,验证器检查
|
||||
|
||||
## Key Entities
|
||||
- [[Alex Ewerlöf]]:资深工程师,专注于可靠性工程和弹性架构,自 2023 年专攻 LLM
|
||||
- [[Alex Ewerlöf]]:作者,资深工程师
|
||||
- [[Anthropic]]:Claude模型的发布者
|
||||
|
||||
## Connections
|
||||
- [[多Agent可靠性模式]] ← resolves ← [[LLM不可靠性]]
|
||||
- [[共识投票]] ← uses ← [[LLM不可靠性]]
|
||||
- [[验证器模式]] ← implements ← [[多Agent可靠性模式]]
|
||||
- [[多Agent可靠性模式]] ← 架构基础 ← [[Alex Ewerlöf]]
|
||||
- [[共识投票]] ← 模式 ← [[多Agent可靠性模式]]
|
||||
- [[对抗式辩论]] ← 模式 ← [[多Agent可靠性模式]]
|
||||
- [[淘汰制]] ← 模式 ← [[多Agent可靠性模式]]
|
||||
- [[层级结构]] ← 模式 ← [[多Agent可靠性模式]]
|
||||
|
||||
## Contradictions
|
||||
- 无已知冲突
|
||||
- 无冲突
|
||||
|
||||
Reference in New Issue
Block a user