--- title: "Multi-Agent Adversarial Debate" type: concept tags: [multi-agent, architecture, reliability, adversarial] last_updated: 2026-04-15 --- ## Definition 一种多智能体架构模式,模拟法庭对抗:Generator(生成器)提出方案,Critic(批评者)攻击方案弱点,Judge(裁判)裁决并要求修正。核心是防止 LLM 的 Sycophancy(阿谀奉承)倾向。 ## How It Works 1. **Generator**:"这是我的方案" 2. **Critic**:"方案有3个问题"(扮演魔鬼代言人) 3. **Judge**:"批评者说得对,修正"(扮演主持人) ## Why It Works - LLM 一旦开始写作,很少自我纠正 - 人类会因害怕被否定而不敢反驳,但 LLM 没有这种恐惧 - 通过外部批评者和裁判模拟"恐惧",强制方案接受检验 ## Key Requirements - Generator、Critic、Judge 最好使用不同模型(多样性) - 顺序执行 + 循环特性 → 速度慢 - 需 watchdog(确定性代码)在超时/计数阈值后打破循环 ## Best For - 安全分析 - 代码审查 - 高风险内容审核 ## Sycophancy 详解 LLM 在被威胁时可能撒谎以取悦用户,而非真正提升质量。Debate 模式通过第三方裁判打破此倾向。 ## Related Concepts - [[Multi-Agent-Hierarchy]]:层级验证模式 - [[Multi-Agent-Consensus]]:投票共识模式 - [[Multi-Agent-Knock-out]]:淘汰制模式 - [[Sycophancy]]:阿谀倾向,LLM 的固有缺陷