feat(wiki): complete final batch 86 remaining raw files ingestion
This commit is contained in:
@@ -1,7 +1,7 @@
|
||||
---
|
||||
title: "Multi-Agent System Reliability"
|
||||
type: source
|
||||
tags: [multi-agent, reliability, architecture]
|
||||
tags: [multi-agent, 可靠性, llm, architecture]
|
||||
date: 2026-04-13
|
||||
---
|
||||
|
||||
@@ -9,38 +9,40 @@ date: 2026-04-13
|
||||
- [[raw/AI/Multi-Agent System Reliability.md]]
|
||||
|
||||
## Summary
|
||||
- 核心主题:提高多智能体系统可靠性的4种架构模式
|
||||
- 问题域:LLM的随机性、幻觉、上下文漂移导致多Agent系统可靠性下降
|
||||
- 方法/机制:Hierarchy(规划-执行-验证)、Consensus(投票)、Adversarial Debate(对抗辩论)、Knock-out(淘汰制)
|
||||
- 结论/价值:停止要求模型"小心",开始强制模型"正确"——将LLM视为不可靠组件而非智能体
|
||||
- 核心主题:提高多智能体系统可靠性的四大架构模式
|
||||
- 问题域:LLM固有的不可靠性(幻觉、逻辑谬误、上下文漂移)如何在多智能体拓扑中传播并被控制
|
||||
- 方法/机制:等级制度(Hierarchy)、共识投票(Consensus)、对抗性辩论(Adversarial Debate)、淘汰制(Knock-out)
|
||||
- 结论/价值:从"AI原型"到"企业级AI"的关键转变:停止将LLM当魔法聊天机器人,开始将其视为分布式系统中不可靠的组件
|
||||
|
||||
## Key Claims
|
||||
- LLMs是随机性的,单一答案只是概率分布
|
||||
- 3个模型同时出现相同幻觉的概率为0.8%(0.2³)
|
||||
- 4种模式:Hierarchy(规划→执行→验证)、Consensus(多数投票)、Adversarial(生成器vs批评者)、Knock-out(最差者淘汰)
|
||||
- 不要拟人化LLM——LLM不会死亡或挨饿,无法真正受到威胁
|
||||
- 等级制度(Hierarchy):Planner分解任务,Worker执行,Validator验证,通过依赖图强制协作
|
||||
- 共识投票(Consensus):N个LLM独立执行同一任务,选多数票;3个模型同时产生相同幻觉概率仅0.8%
|
||||
- 对抗性辩论(Adversarial Debate):Generator提方案,Critic攻击,Judge裁决;用外部批评者模拟"恐惧"
|
||||
- 淘汰制(Knock-out):N个Agent竞争,验证器决定淘汰谁;LLM Agent是"cattle not pets"
|
||||
- 核心原则:构建稳健系统需停止要求模型"小心",开始强制它"正确"
|
||||
|
||||
## Key Quotes
|
||||
> "Don't anthropomorphize LLMs! Find a way to piggy back on their human-corpus training while being aware of their non-biological differences."
|
||||
> "We don't need AI that 'cares.' We need AI that is constrained, verified, pruned, and challenged."
|
||||
> "To build robust systems, we need to stop asking the model to 'be careful' and start forcing it to be correct" — Alex Ewerlöf
|
||||
> "Don't anthropomorphize LLMs! Find a way to piggy back on their human-corpus training while being aware of their non-biological differences" — Alex Ewerlöf
|
||||
|
||||
## Key Concepts
|
||||
- [[多Agent可靠性模式]]:Hierarchy、Consensus、Adversarial Debate、Knock-out四大架构
|
||||
- [[共识投票]]:利用多数投票抵消单一模型的随机噪声
|
||||
- [[对抗式辩论]]:生成器提出方案,批评者攻击,裁判评判
|
||||
- [[淘汰制]]:最差Agent被淘汰,适者生存
|
||||
- [[层级结构]]:规划器分配任务,工作器执行,验证器检查
|
||||
- [[多Agent可靠性模式]]:等级制度、共识投票、对抗性辩论、淘汰制四种架构模式
|
||||
- [[共识投票]]:多数票机制降低LLM幻觉概率
|
||||
- [[对抗性辩论]]:用外部批评者模拟恐惧感,避免模型自我中心
|
||||
- [[淘汰制]]:对待LLM Agent如"cattle"(可替换)而非"pets"(独特珍贵)
|
||||
- [[依赖图强制协作]]:Planner→Worker→Validator顺序执行,Worker必须等待Planner输入
|
||||
|
||||
## Key Entities
|
||||
- [[Alex Ewerlöf]]:作者,资深工程师
|
||||
- [[Anthropic]]:Claude模型的发布者
|
||||
- [[Alex Ewerlöf]]:作者,27年经验的资深工程师,可靠性工程专家
|
||||
- [[LLM]]:多智能体系统的底层不可靠组件
|
||||
|
||||
## Connections
|
||||
- [[多Agent可靠性模式]] ← 架构基础 ← [[Alex Ewerlöf]]
|
||||
- [[共识投票]] ← 模式 ← [[多Agent可靠性模式]]
|
||||
- [[对抗式辩论]] ← 模式 ← [[多Agent可靠性模式]]
|
||||
- [[淘汰制]] ← 模式 ← [[多Agent可靠性模式]]
|
||||
- [[层级结构]] ← 模式 ← [[多Agent可靠性模式]]
|
||||
- [[多Agent可靠性模式]] ← 核心主题 ← 可靠性工程
|
||||
- [[等级制度]] ← 模式1 ← [[多Agent可靠性模式]]
|
||||
- [[共识投票]] ← 模式2 ← [[多Agent可靠性模式]]
|
||||
- [[对抗性辩论]] ← 模式3 ← [[多Agent可靠性模式]]
|
||||
- [[淘汰制]] ← 模式4 ← [[多Agent可靠性模式]]
|
||||
|
||||
## Contradictions
|
||||
- 无冲突
|
||||
- 与传统单LLM使用对比:单LLM依赖模型自身可靠性;多智能体通过架构模式引入冗余和验证机制
|
||||
- 与拟人化LLM谬误对比:不应将LLM视为有情感和恐惧的实体,而应视为不可靠但可优化的组件
|
||||
|
||||
Reference in New Issue
Block a user