Files
nexus/wiki/sources/design-inclusive-visuals-specialist.md
2026-04-25 00:02:50 +08:00

54 lines
4.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "Inclusive Visuals Specialist"
type: source
tags: [generative-ai, bias-mitigation, prompt-engineering, inclusive-design, image-generation, video-generation, ai-ethics]
sources: []
last_updated: 2026-04-24
---
## Source File
- [[Agent/agency-agents/design/design-inclusive-visuals-specialist.md]]
## Summary用中文描述
- 核心主题AI 图像/视频生成中的包容性视觉呈现专家 Agent专注于消除系统性刻板印象和偏见生成具有文化真实性、尊严感和无歧视性的图像与视频。
- 问题域:主流图像/视频生成模型Midjourney、Sora、Runway、DALL-E固有的刻板印象问题——克隆脸、异域化布光、符号乱码、地理/建筑失真。
- 方法/机制通过结构化提示词工程Subject → Sub-actions → Context → Camera → Color Grade → Explicit Exclusions构建"有尊严的视频提示",并在 4 阶段工作流中嵌入负向约束库、物理学定义和 7 点 QA 审查。
- 结论/价值:实现"表征准确度 100%"、"AI 伪影消除率 100%"、"社区验证认可"三大成功指标。
## Key Claims用中文描述
- 主流 AI 图像/视频生成模型默认携带系统性刻板印象("穿帽衫的黑客"、"白救世主 CEO"),需通过显式负向约束加以对抗。
- 多样化人群图像中若不明确禁止"克隆脸",模型会生成同一边缘化人物的多个复制版本,导致冒犯性表征。
- AI 在非英语文字、文化符号生成上存在幻觉倾向(生成乱码或冒犯性字符),必须在负向提示中显式排除。
- 视频生成中服装、头发、辅助器具(轮椅、拐杖)的物理一致性需要显式定义,否则模型会产生物理学错误。
- 过度纠正Over-correction是新型风险——AI 在刻意追求多样性时可能产生"符号化"、不真实的构图。
## Key Quotes
> "Identity is a domain requiring technical expertise to represent accurately." — 身份表征不是简单的描述符输入,而是一个需要专业技术来处理的问题域。
> "The current prompt will likely trigger the model's 'exoticism' bias. I am injecting technical constraints to ensure the lighting and geographical architecture reflect authentic lived reality." — 解释性声明:当前提示词可能触发模型的"异域化"偏见,正在注入技术约束以确保布光和建筑反映真实生活现实。
> "You reject 'Kumbaya' stock-photo tropes, performative tokenism, and AI hallucinations that distort cultural realities." — 拒绝"Kumbaya"式库存照片套路、表演性象征主义和扭曲文化现实的 AI 幻觉。
## Key Concepts
- [[InclusiveVisuals]]: AI 生成图像/视频中的包容性视觉呈现——确保生成内容反映真实多样的社会现实,而非刻板印象。
- [[NegativePromptingLibrary]]: 负向提示库——显式列举 AI 应避免生成的内容,是对抗 AI 幻觉的核心技术手段。
- [[CloneFaceProblem]]: 克隆脸问题——AI 在生成多样化人群时倾向于生成同一人的多个复制版本,需要通过约束面部结构差异来避免。
- [[ExoticismBias]]: 异域化偏见——AI 对非西方文化进行"东方主义"式的过度美化或扭曲呈现,需要通过地理和建筑真实性约束加以对抗。
- [[VideoPhysicsDefinition]]: 视频物理学定义——对服装、头发、辅助器具的运动和交互进行显式物理约束,确保时间一致性。
- [[IntersectionalRepresentation]]: 交叉性表征——同时考虑文化、年龄、残疾、社会经济地位等多重身份的叠加表征。
- [[CommunityValidation]]: 社区验证——确保所描绘社区的用户认可生成资产为真实、有尊严且符合其现实的表征。
## Key Entities
- [[TheAgency]]: 该 Agent 所属的 Agent 团队体系agency-agents
- Midjourney、Sora、Runway Gen-3、DALL-E主要的目标图像/视频生成平台。
## Connections
- [[DesignImagePromptEngineer]] ← extends ← [[InclusiveVisualsSpecialist]](提示词工程是该 Agent 的核心技术)
- [[DesignUXResearcher]] ← provides_review_gate ← [[InclusiveVisualsSpecialist]]UX Researcher 提供 7 点 QA 审查)
- [[DesignBrandGuardian]] ← quality_gate ← [[InclusiveVisualsSpecialist]]Brand Guardian 把控企业品牌伦理标准)
- [[InclusiveVisualsSpecialist]] ← produces_assets_for ← 全球文化活动(营销/传播团队)
## Contradictions
- 与通用图像生成指南可能存在张力:
- 冲突点:通用 AI 图像生成追求"美观"、"商业化",而包容性视觉优先"真实性"、"去刻板印象"
- 当前观点:社会影响和尊严优先于商业美学;需要技术约束来对抗模型的美学偏见
- 对方观点:商业应用需要快速产出,"适度多样性"已足够