nexus/wiki/concepts/Adversarial-Debate-Pattern.md

---
title: "Adversarial Debate Pattern"
type: concept
tags: []
sources:
  - multi-agent-system-reliability
last_updated: 2026-04-28
---

# Adversarial Debate Pattern

## 定义
多智能体系统的对抗式辩论模式——一个Agent提出方案，另一个Agent攻击反驳，由第三个Agent（裁判）决定胜负。核心是用外部批评者和评判者模拟人类的"恐惧"动机。

## 角色
- **Generator**："Here is my plan."（生成方案）
- **Critic**："Here are 3 reasons why that plan sucks."（扮演魔鬼代言人）
- **Judge**："The Critic is right. Fix it."（裁判/主持人）

## 核心洞察
LLM是"Yes-Men"，一旦开始写作很少自我纠正——需要一个指定的反对者来打破这种惯性。

## 关键机制
- 三方应使用**不同模型**（不同训练/微调/提示），多样性有益
- 顺序执行+循环特性导致速度可能非常慢
- Agent可能陷入无限辩论——可使用**Watchdog**（确定性代码）在时间/次数超阈值时打破循环

## 适用场景
- 安全分析（Security Analysis）
- 代码审查（Code Review）
- 高风险内容审核（High-Stakes Content Moderation）

## 来源
- [[multi-agent-system-reliability]]