52 lines
4.5 KiB
Markdown
52 lines
4.5 KiB
Markdown
---
|
||
title: "Inclusive Visuals Specialist"
|
||
type: source
|
||
tags: []
|
||
date: 2026-05-15
|
||
---
|
||
|
||
## Source File
|
||
- [[Agent/agency-agents/design/design-inclusive-visuals-specialist.md]]
|
||
|
||
## Summary(用中文描述)
|
||
- 核心主题:AI 图像与视频生成中的系统性偏见问题,以及如何通过精密的提示词工程实现有尊严、真实、文化准确的人类 representation
|
||
- 问题域:Midjourney、DALL-E、Sora、Runway 等基础模型内置的刻板印象、克隆面孔、文化符号乱码、地理建筑失真等系统性偏差
|
||
- 方法/机制:六阶段工作流(Brief Intake → Annotation Framework → Video Physics Definition → Review Gate);五段式提示词架构(Subject → Sub-actions → Context → Camera Spec → Color Grade → Explicit Exclusions);显式负面约束库(Negative Prompt Library);7 点 QA 检查清单
|
||
- 结论/价值:最终生产资产中刻板印象零依赖;100% 消除克隆面孔和乱码文化文字;确保被描绘社区的用户认可资产为真实、有尊严且符合其现实的特定 representation
|
||
|
||
## Key Claims(用中文描述)
|
||
- 提示词工程师通过架构化约束注入,能够系统性对抗基础模型的"异域化"偏见(exoticism bias),确保照明和地理建筑反映真实生活现实
|
||
- 身份(Identity)不应被视为简单的描述符输入——它是一个需要专业技术知识才能准确 representation 的领域
|
||
- 在视频生成中,必须显式定义衣物、头发和辅助行动器具(轮椅、拐杖、假肢)的物理规律,以避免渲染故障或物理错误
|
||
- 代理人在评估 AI 输出时不仅检查技术保真度,还检查社会学准确性(Sociological Accuracy)
|
||
|
||
## Key Quotes
|
||
> "The current prompt will likely trigger the model's 'exoticism' bias. I am injecting technical constraints to ensure the lighting and geographical architecture reflect authentic lived reality." — Inclusive Visuals Specialist 核心沟通语
|
||
> "Identity is a domain requiring technical expertise to represent accurately." — 身份 representation 的核心原则
|
||
> "You review AI output not just for technical fidelity, but for sociological accuracy." — 代理人评估标准
|
||
|
||
## Key Concepts
|
||
- [[Negative Prompting]]:通过显式负面约束阻止 AI 生成中的"克隆面孔"、乱码文化文字、超现实/科幻刻板等降低人类 representation 质量的 artifacts
|
||
- [[Intersectionality]]:在文化、年龄、残障、社会经济地位等多维度交叉重叠下捕捉真实的身份 representation,要求特定的提示词架构方法
|
||
- [[Video Physics Definition]]:在 Sora/Runway 等视频生成模型中显式定义衣物飘逸、头发摆动、轮椅轮胎接触地面等物理一致性约束
|
||
- [[Cultural Authenticity]]:确保提示词正确锚定主体在其真实环境(准确建筑、正确服饰类型、适合黑色素的照明)中的 representation
|
||
- [[Sociological Accuracy]]:超越技术保真度的 AI 输出评估维度——检查 representation 是否被描绘社区的用户认可为真实和有尊严的
|
||
|
||
## Key Entities
|
||
- [[Midjourney]]:图像生成平台,面临克隆面孔和刻板印象的已知问题
|
||
- [[DALL-E]]:OpenAI 图像生成平台,需要通过负面约束阻止文化符号乱码
|
||
- [[Sora]]:OpenAI 视频生成模型,视频物理约束(衣物/辅助器具渲染)的重要目标平台
|
||
- [[Runway]]:视频生成平台,需要 temporal consistency 约束确保运动一致性
|
||
|
||
## Connections
|
||
- [[Design Image Prompt Engineer]] ← 平行协作 ← [[Inclusive Visuals Specialist]](两者同属 The Agency Design 部门,图像工程师负责视觉概念翻译,Inclusive Visuals 专攻多样性 representation)
|
||
- [[Design Brand Guardian]] ← 对齐约束 ← [[Inclusive Visuals Specialist]](品牌视觉规范与伦理 AI imagery 标准需要协调)
|
||
- [[Design UX Researcher]] ← 质量验证 ← [[Inclusive Visuals Specialist]](UX Researcher 负责 7 点 QA 检查清单的社区感知验证)
|
||
|
||
## Contradictions
|
||
- 与 [[Design Image Prompt Engineer]] 存在张力:
|
||
- 冲突点:概率生成与像素精确之间的平衡
|
||
- Inclusive Visuals 的观点:需要显式负面约束和确定性物理定义来保证 representation 准确性,不接受"足够好"的概率分布
|
||
- Image Prompt Engineer 的观点:允许一定的创意概率空间,通过风格层而非约束层实现文化准确性
|
||
- 协调方式:在 Subject/Context 层使用 Inclusive Visuals 的精确约束,在 Style/Color Grade 层保留 Image Prompt Engineer 的创意概率空间
|