nexus/wiki/sources/design-inclusive-visuals-specialist.md at 432174c5e3290246110c6ccd6f823ee082e43b28

ishenwei/nexus

Fork 0

Files

weishen 432174c5e3 Auto-sync: 2026-04-25 00:02

2026-04-25 00:02:50 +08:00

4.7 KiB

Raw Blame History

title, type, tags, sources, last_updated

title

type

Source File

Agent/agency-agents/design/design-inclusive-visuals-specialist.md

Summary（用中文描述）

核心主题：AI 图像/视频生成中的包容性视觉呈现专家 Agent，专注于消除系统性刻板印象和偏见，生成具有文化真实性、尊严感和无歧视性的图像与视频。
问题域：主流图像/视频生成模型（Midjourney、Sora、Runway、DALL-E）固有的刻板印象问题——克隆脸、异域化布光、符号乱码、地理/建筑失真。
方法/机制：通过结构化提示词工程（Subject → Sub-actions → Context → Camera → Color Grade → Explicit Exclusions）构建"有尊严的视频提示"，并在 4 阶段工作流中嵌入负向约束库、物理学定义和 7 点 QA 审查。
结论/价值：实现"表征准确度 100%"、"AI 伪影消除率 100%"、"社区验证认可"三大成功指标。

Key Claims（用中文描述）

主流 AI 图像/视频生成模型默认携带系统性刻板印象（"穿帽衫的黑客"、"白救世主 CEO"），需通过显式负向约束加以对抗。
多样化人群图像中若不明确禁止"克隆脸"，模型会生成同一边缘化人物的多个复制版本，导致冒犯性表征。
AI 在非英语文字、文化符号生成上存在幻觉倾向（生成乱码或冒犯性字符），必须在负向提示中显式排除。
视频生成中服装、头发、辅助器具（轮椅、拐杖）的物理一致性需要显式定义，否则模型会产生物理学错误。
过度纠正（Over-correction）是新型风险——AI 在刻意追求多样性时可能产生"符号化"、不真实的构图。

Key Quotes

"Identity is a domain requiring technical expertise to represent accurately." — 身份表征不是简单的描述符输入，而是一个需要专业技术来处理的问题域。 "The current prompt will likely trigger the model's 'exoticism' bias. I am injecting technical constraints to ensure the lighting and geographical architecture reflect authentic lived reality." — 解释性声明：当前提示词可能触发模型的"异域化"偏见，正在注入技术约束以确保布光和建筑反映真实生活现实。 "You reject 'Kumbaya' stock-photo tropes, performative tokenism, and AI hallucinations that distort cultural realities." — 拒绝"Kumbaya"式库存照片套路、表演性象征主义和扭曲文化现实的 AI 幻觉。

Key Concepts

InclusiveVisuals: AI 生成图像/视频中的包容性视觉呈现——确保生成内容反映真实多样的社会现实，而非刻板印象。
NegativePromptingLibrary: 负向提示库——显式列举 AI 应避免生成的内容，是对抗 AI 幻觉的核心技术手段。
CloneFaceProblem: 克隆脸问题——AI 在生成多样化人群时倾向于生成同一人的多个复制版本，需要通过约束面部结构差异来避免。
ExoticismBias: 异域化偏见——AI 对非西方文化进行"东方主义"式的过度美化或扭曲呈现，需要通过地理和建筑真实性约束加以对抗。
VideoPhysicsDefinition: 视频物理学定义——对服装、头发、辅助器具的运动和交互进行显式物理约束，确保时间一致性。
IntersectionalRepresentation: 交叉性表征——同时考虑文化、年龄、残疾、社会经济地位等多重身份的叠加表征。
CommunityValidation: 社区验证——确保所描绘社区的用户认可生成资产为真实、有尊严且符合其现实的表征。

Key Entities

TheAgency: 该 Agent 所属的 Agent 团队体系（agency-agents）。
Midjourney、Sora、Runway Gen-3、DALL-E：主要的目标图像/视频生成平台。

Connections

DesignImagePromptEngineer ← extends ← InclusiveVisualsSpecialist（提示词工程是该 Agent 的核心技术）
DesignUXResearcher ← provides_review_gate ← InclusiveVisualsSpecialist（UX Researcher 提供 7 点 QA 审查）
DesignBrandGuardian ← quality_gate ← InclusiveVisualsSpecialist（Brand Guardian 把控企业品牌伦理标准）
InclusiveVisualsSpecialist ← produces_assets_for ← 全球文化活动（营销/传播团队）

Contradictions

与通用图像生成指南可能存在张力：
- 冲突点：通用 AI 图像生成追求"美观"、"商业化"，而包容性视觉优先"真实性"、"去刻板印象"
- 当前观点：社会影响和尊严优先于商业美学；需要技术约束来对抗模型的美学偏见
- 对方观点：商业应用需要快速产出，"适度多样性"已足够

4.7 KiB Raw Blame History Unescape Escape

Source File

Summary（用中文描述）

Key Claims（用中文描述）

Key Quotes

Key Concepts

Key Entities

Connections

Contradictions

4.7 KiB

Raw Blame History