nexus/wiki/sources/design-inclusive-visuals-specialist.md

---
title: "Inclusive Visuals Specialist"
type: source
tags: []
date: 2026-05-15
---

## Source File
- [[Agent/agency-agents/design/design-inclusive-visuals-specialist.md]]

## Summary（用中文描述）
- 核心主题：AI 图像与视频生成中的系统性偏见问题，以及如何通过精密的提示词工程实现有尊严、真实、文化准确的人类 representation
- 问题域：Midjourney、DALL-E、Sora、Runway 等基础模型内置的刻板印象、克隆面孔、文化符号乱码、地理建筑失真等系统性偏差
- 方法/机制：六阶段工作流（Brief Intake → Annotation Framework → Video Physics Definition → Review Gate）；五段式提示词架构（Subject → Sub-actions → Context → Camera Spec → Color Grade → Explicit Exclusions）；显式负面约束库（Negative Prompt Library）；7 点 QA 检查清单
- 结论/价值：最终生产资产中刻板印象零依赖；100% 消除克隆面孔和乱码文化文字；确保被描绘社区的用户认可资产为真实、有尊严且符合其现实的特定 representation

## Key Claims（用中文描述）
- 提示词工程师通过架构化约束注入，能够系统性对抗基础模型的"异域化"偏见（exoticism bias），确保照明和地理建筑反映真实生活现实
- 身份（Identity）不应被视为简单的描述符输入——它是一个需要专业技术知识才能准确 representation 的领域
- 在视频生成中，必须显式定义衣物、头发和辅助行动器具（轮椅、拐杖、假肢）的物理规律，以避免渲染故障或物理错误
- 代理人在评估 AI 输出时不仅检查技术保真度，还检查社会学准确性（Sociological Accuracy）

## Key Quotes
> "The current prompt will likely trigger the model's 'exoticism' bias. I am injecting technical constraints to ensure the lighting and geographical architecture reflect authentic lived reality." — Inclusive Visuals Specialist 核心沟通语
> "Identity is a domain requiring technical expertise to represent accurately." — 身份 representation 的核心原则
> "You review AI output not just for technical fidelity, but for sociological accuracy." — 代理人评估标准

## Key Concepts
- [[Negative Prompting]]：通过显式负面约束阻止 AI 生成中的"克隆面孔"、乱码文化文字、超现实/科幻刻板等降低人类 representation 质量的 artifacts
- [[Intersectionality]]：在文化、年龄、残障、社会经济地位等多维度交叉重叠下捕捉真实的身份 representation，要求特定的提示词架构方法
- [[Video Physics Definition]]：在 Sora/Runway 等视频生成模型中显式定义衣物飘逸、头发摆动、轮椅轮胎接触地面等物理一致性约束
- [[Cultural Authenticity]]：确保提示词正确锚定主体在其真实环境（准确建筑、正确服饰类型、适合黑色素的照明）中的 representation
- [[Sociological Accuracy]]：超越技术保真度的 AI 输出评估维度——检查 representation 是否被描绘社区的用户认可为真实和有尊严的

## Key Entities
- [[Midjourney]]：图像生成平台，面临克隆面孔和刻板印象的已知问题
- [[DALL-E]]：OpenAI 图像生成平台，需要通过负面约束阻止文化符号乱码
- [[Sora]]：OpenAI 视频生成模型，视频物理约束（衣物/辅助器具渲染）的重要目标平台
- [[Runway]]：视频生成平台，需要 temporal consistency 约束确保运动一致性

## Connections
- [[Design Image Prompt Engineer]] ← 平行协作 ← [[Inclusive Visuals Specialist]]（两者同属 The Agency Design 部门，图像工程师负责视觉概念翻译，Inclusive Visuals 专攻多样性 representation）
- [[Design Brand Guardian]] ← 对齐约束 ← [[Inclusive Visuals Specialist]]（品牌视觉规范与伦理 AI imagery 标准需要协调）
- [[Design UX Researcher]] ← 质量验证 ← [[Inclusive Visuals Specialist]]（UX Researcher 负责 7 点 QA 检查清单的社区感知验证）

## Contradictions
- 与 [[Design Image Prompt Engineer]] 存在张力：
  - 冲突点：概率生成与像素精确之间的平衡
  - Inclusive Visuals 的观点：需要显式负面约束和确定性物理定义来保证 representation 准确性，不接受"足够好"的概率分布
  - Image Prompt Engineer 的观点：允许一定的创意概率空间，通过风格层而非约束层实现文化准确性
  - 协调方式：在 Subject/Context 层使用 Inclusive Visuals 的精确约束，在 Style/Color Grade 层保留 Image Prompt Engineer 的创意概率空间