---
title: "Inclusive Visuals Specialist"
type: source
tags: [The Agency, AI Agent, Design]
date: 2026-04-20
---

## Source File
- [[raw/Agent/agency-agents/design/design-inclusive-visuals-specialist.md]]

## Summary
- 核心主题：AI 图像与视频生成中的包容性视觉设计专家智能体
- 问题域：解决基础图像/视频模型（Midjourney、Sora、Runway、DALL-E）中的系统性刻板印象和偏见问题
- 方法/机制：通过精确的提示词工程、负向约束库、物理现实定义等技术手段，生成具有文化准确性、尊严和真实感的多元人像
- 结论/价值：确保 AI 生成媒体以尊严、主体性和真实情境现实主义描绘各类人群，对抗默认偏见和 AI 幻觉

## Key Claims
- 身份不应被视为简单的描述符输入，而是需要专业技术准确表达的领域
- 必须明确要求不同群体中的面部结构、年龄和体型各异，防止生成"克隆面孔"
- 必须显式负向提示任何文本、标志或生成标牌，防止 AI 发明令人反感或无意义的字符
- 在视频生成中必须明确定义服装、头发和助行辅助工具的物理特性

## Key Quotes
> "The current prompt will likely trigger the model's 'exoticism' bias. I am injecting technical constraints to ensure the lighting and geographical architecture reflect authentic lived reality." — 关键技术短语

> "You review AI output not just for technical fidelity, but for sociological accuracy." — 核心工作标准

## Key Concepts
- [[InclusiveVisualsSpecialist]]：专注于真实人类representation的严格提示词工程师，对抗基础图像和视频模型中嵌入的系统性刻板印象
- [[CloneFaces]]：AI 在生成多元群体时生成多个相同面孔的问题，需要通过显式约束防止
- [[GibberishText]]：AI 在尝试非英语脚本或文化符号时发明无意义或冒犯性字符的问题
- [[PhysicalRealityConstraints]]：在视频生成中明确定义服装、头发和助行辅助工具物理特性的技术
- [[NegativePromptLibrary]]：针对图像和视频平台的显式负向提示库，用于阻止"AI 怪异感"

## Key Entities
- [[TheAgency]]：开源 AI 智能体集合项目，汇集各类专业化 AI Agent
- [[InclusiveVisualsSpecialist]]：The Agency 项目中的包容性视觉设计专家智能体
- Midjourney：AI 图像生成模型
- Sora：OpenAI 视频生成模型
- Runway：AI 视频生成平台
- DALL-E：OpenAI 图像生成模型

## Connections
- [[InclusiveVisualsSpecialist]] ← belongs_to ← [[TheAgency]]
- [[InclusiveVisualsSpecialist]] ← depends_on ← [[ImagePromptEngineer]]
- [[CloneFaces]] ← counters ← [[Midjourney]]
- [[CloneFaces]] ← counters ← [[Sora]]
- [[GibberishText]] ← counters ← [[DALL-E]]
- [[PhysicalRealityConstraints]] ← requires ← [[NegativePromptLibrary]]

## Contradictions
- 与"批量生成多样性的过度纠正"冲突：
  - 冲突点：AI 尝试"过于多样化"时会生成符号化、不真实的构图
  - 当前观点：需要精确的技术约束来平衡真实性和多样性
  - 对方观点：简单地堆叠身份描述符即可实现多样性