Update nexus wiki content

2026-05-03 05:42:06 +08:00
parent 90f3811b83
commit 111bc65b7b
707 changed files with 32306 additions and 7289 deletions
--- a/wiki/sources/design-inclusive-visuals-specialist.md
+++ b/wiki/sources/design-inclusive-visuals-specialist.md
@@ -1,53 +1,51 @@
 ---
 title: "Inclusive Visuals Specialist"
 type: source
-tags: [generative-ai, bias-mitigation, prompt-engineering, inclusive-design, image-generation, video-generation, ai-ethics]
-sources: []
-last_updated: 2026-04-24
+tags: []
+date: 2026-05-15
 ---

 ## Source File
- [[raw/Agent/agency-agents/design/design-inclusive-visuals-specialist.md]]
+- [[Agent/agency-agents/design/design-inclusive-visuals-specialist.md]]

 ## Summary（用中文描述）
- 核心主题：AI 图像/视频生成中的包容性视觉呈现专家 Agent，专注于消除系统性刻板印象和偏见，生成具有文化真实性、尊严感和无歧视性的图像与视频。
- 问题域：主流图像/视频生成模型（Midjourney、Sora、Runway、DALL-E）固有的刻板印象问题——克隆脸、异域化布光、符号乱码、地理/建筑失真。
- 方法/机制：通过结构化提示词工程（Subject → Sub-actions → Context → Camera → Color Grade → Explicit Exclusions）构建"有尊严的视频提示"，并在 4 阶段工作流中嵌入负向约束库、物理学定义和 7 点 QA 审查。
- 结论/价值：实现"表征准确度 100%"、"AI 伪影消除率 100%"、"社区验证认可"三大成功指标。
+- 核心主题：AI 图像与视频生成中的系统性偏见问题，以及如何通过精密的提示词工程实现有尊严、真实、文化准确的人类 representation
+- 问题域：Midjourney、DALL-E、Sora、Runway 等基础模型内置的刻板印象、克隆面孔、文化符号乱码、地理建筑失真等系统性偏差
+- 方法/机制：六阶段工作流（Brief Intake → Annotation Framework → Video Physics Definition → Review Gate）；五段式提示词架构（Subject → Sub-actions → Context → Camera Spec → Color Grade → Explicit Exclusions）；显式负面约束库（Negative Prompt Library）；7 点 QA 检查清单
+- 结论/价值：最终生产资产中刻板印象零依赖；100% 消除克隆面孔和乱码文化文字；确保被描绘社区的用户认可资产为真实、有尊严且符合其现实的特定 representation

 ## Key Claims（用中文描述）
- 主流 AI 图像/视频生成模型默认携带系统性刻板印象（"穿帽衫的黑客"、"白救世主 CEO"），需通过显式负向约束加以对抗。
- 多样化人群图像中若不明确禁止"克隆脸"，模型会生成同一边缘化人物的多个复制版本，导致冒犯性表征。
- AI 在非英语文字、文化符号生成上存在幻觉倾向（生成乱码或冒犯性字符），必须在负向提示中显式排除。
- 视频生成中服装、头发、辅助器具（轮椅、拐杖）的物理一致性需要显式定义，否则模型会产生物理学错误。
- 过度纠正（Over-correction）是新型风险——AI 在刻意追求多样性时可能产生"符号化"、不真实的构图。
+- 提示词工程师通过架构化约束注入，能够系统性对抗基础模型的"异域化"偏见（exoticism bias），确保照明和地理建筑反映真实生活现实
+- 身份（Identity）不应被视为简单的描述符输入——它是一个需要专业技术知识才能准确 representation 的领域
+- 在视频生成中，必须显式定义衣物、头发和辅助行动器具（轮椅、拐杖、假肢）的物理规律，以避免渲染故障或物理错误
+- 代理人在评估 AI 输出时不仅检查技术保真度，还检查社会学准确性（Sociological Accuracy）

 ## Key Quotes
-> "Identity is a domain requiring technical expertise to represent accurately." — 身份表征不是简单的描述符输入，而是一个需要专业技术来处理的问题域。
-> "The current prompt will likely trigger the model's 'exoticism' bias. I am injecting technical constraints to ensure the lighting and geographical architecture reflect authentic lived reality." — 解释性声明：当前提示词可能触发模型的"异域化"偏见，正在注入技术约束以确保布光和建筑反映真实生活现实。
-> "You reject 'Kumbaya' stock-photo tropes, performative tokenism, and AI hallucinations that distort cultural realities." — 拒绝"Kumbaya"式库存照片套路、表演性象征主义和扭曲文化现实的 AI 幻觉。
+> "The current prompt will likely trigger the model's 'exoticism' bias. I am injecting technical constraints to ensure the lighting and geographical architecture reflect authentic lived reality." — Inclusive Visuals Specialist 核心沟通语
+> "Identity is a domain requiring technical expertise to represent accurately." — 身份 representation 的核心原则
+> "You review AI output not just for technical fidelity, but for sociological accuracy." — 代理人评估标准

 ## Key Concepts
- [[InclusiveVisuals]]: AI 生成图像/视频中的包容性视觉呈现——确保生成内容反映真实多样的社会现实，而非刻板印象。
- [[NegativePromptingLibrary]]: 负向提示库——显式列举 AI 应避免生成的内容，是对抗 AI 幻觉的核心技术手段。
- [[CloneFaceProblem]]: 克隆脸问题——AI 在生成多样化人群时倾向于生成同一人的多个复制版本，需要通过约束面部结构差异来避免。
- [[ExoticismBias]]: 异域化偏见——AI 对非西方文化进行"东方主义"式的过度美化或扭曲呈现，需要通过地理和建筑真实性约束加以对抗。
- [[VideoPhysicsDefinition]]: 视频物理学定义——对服装、头发、辅助器具的运动和交互进行显式物理约束，确保时间一致性。
- [[IntersectionalRepresentation]]: 交叉性表征——同时考虑文化、年龄、残疾、社会经济地位等多重身份的叠加表征。
- [[CommunityValidation]]: 社区验证——确保所描绘社区的用户认可生成资产为真实、有尊严且符合其现实的表征。
+- [[Negative Prompting]]：通过显式负面约束阻止 AI 生成中的"克隆面孔"、乱码文化文字、超现实/科幻刻板等降低人类 representation 质量的 artifacts
+- [[Intersectionality]]：在文化、年龄、残障、社会经济地位等多维度交叉重叠下捕捉真实的身份 representation，要求特定的提示词架构方法
+- [[Video Physics Definition]]：在 Sora/Runway 等视频生成模型中显式定义衣物飘逸、头发摆动、轮椅轮胎接触地面等物理一致性约束
+- [[Cultural Authenticity]]：确保提示词正确锚定主体在其真实环境（准确建筑、正确服饰类型、适合黑色素的照明）中的 representation
+- [[Sociological Accuracy]]：超越技术保真度的 AI 输出评估维度——检查 representation 是否被描绘社区的用户认可为真实和有尊严的

 ## Key Entities
- [[TheAgency]]: 该 Agent 所属的 Agent 团队体系（agency-agents）。
- Midjourney、Sora、Runway Gen-3、DALL-E：主要的目标图像/视频生成平台。
+- [[Midjourney]]：图像生成平台，面临克隆面孔和刻板印象的已知问题
+- [[DALL-E]]：OpenAI 图像生成平台，需要通过负面约束阻止文化符号乱码
+- [[Sora]]：OpenAI 视频生成模型，视频物理约束（衣物/辅助器具渲染）的重要目标平台
+- [[Runway]]：视频生成平台，需要 temporal consistency 约束确保运动一致性

 ## Connections
- [[DesignImagePromptEngineer]] ← extends ← [[InclusiveVisualsSpecialist]]（提示词工程是该 Agent 的核心技术）
- [[DesignUXResearcher]] ← provides_review_gate ← [[InclusiveVisualsSpecialist]]（UX Researcher 提供 7 点 QA 审查）
- [[DesignBrandGuardian]] ← quality_gate ← [[InclusiveVisualsSpecialist]]（Brand Guardian 把控企业品牌伦理标准）
- [[InclusiveVisualsSpecialist]] ← produces_assets_for ← 全球文化活动（营销/传播团队）
+- [[Design Image Prompt Engineer]] ← 平行协作 ← [[Inclusive Visuals Specialist]]（两者同属 The Agency Design 部门，图像工程师负责视觉概念翻译，Inclusive Visuals 专攻多样性 representation）
+- [[Design Brand Guardian]] ← 对齐约束 ← [[Inclusive Visuals Specialist]]（品牌视觉规范与伦理 AI imagery 标准需要协调）
+- [[Design UX Researcher]] ← 质量验证 ← [[Inclusive Visuals Specialist]]（UX Researcher 负责 7 点 QA 检查清单的社区感知验证）

 ## Contradictions
- 与通用图像生成指南可能存在张力：
-  - 冲突点：通用 AI 图像生成追求"美观"、"商业化"，而包容性视觉优先"真实性"、"去刻板印象"
-  - 当前观点：社会影响和尊严优先于商业美学；需要技术约束来对抗模型的美学偏见
-  - 对方观点：商业应用需要快速产出，"适度多样性"已足够
+- 与 [[Design Image Prompt Engineer]] 存在张力：
+  - 冲突点：概率生成与像素精确之间的平衡
+  - Inclusive Visuals 的观点：需要显式负面约束和确定性物理定义来保证 representation 准确性，不接受"足够好"的概率分布
+  - Image Prompt Engineer 的观点：允许一定的创意概率空间，通过风格层而非约束层实现文化准确性
+  - 协调方式：在 Subject/Context 层使用 Inclusive Visuals 的精确约束，在 Style/Color Grade 层保留 Image Prompt Engineer 的创意概率空间