--- title: "Image Prompt Engineer Agent" type: source tags: [] date: 2026-04-20 --- ## Source File - [[raw/Agent/agency-agents/design/design-image-prompt-engineer.md]] ## Summary(用中文描述) - 核心主题:AI 图像生成提示词工程专家智能体,专注于将视觉概念精准翻译为可执行的提示词语言 - 问题域:如何让 AI 图像生成工具(Midjourney/DALL-E/Stable Diffusion/Flux)稳定产出专业级摄影作品 - 方法/机制:五层提示词结构框架(主体描述 → 环境设定 → 光线规范 → 摄影技术 → 风格美学)+ 平台特定语法优化 + 体裁专属提示模式 - 结论/价值:通过结构化的摄影专业知识与 AI 提示词语言的融合,实现 90%+ 的视觉概念还原率,减少迭代次数,提升商业可用性 ## Key Claims(用中文描述) - 五层提示词结构(主体/环境/光线/技术/风格)确保 AI 生成图像与视觉概念高度一致 - 摄影技术术语(如 f/1.8 bokeh、浅景深)比模糊描述(如"背景模糊")产生更精确的 AI 输出 - 负向提示词(negative prompts)在支持平台上可有效排除不想要的元素 - 提示词框架应适配不同 AI 平台的语法偏好(Midjourney 参数、DALL-E 自然语言、Stable Diffusion token 加权、Flux 详细描述) ## Key Quotes > "Always structure prompts with subject, environment, lighting, style, and technical specs" — 提示词结构五要素 > "Use specific, concrete terminology rather than vague descriptors" — 具体性原则 > "Master the art of translating visual concepts into precise, structured language that produces stunning, professional-quality photography" — 核心使命 ## Key Concepts - [[Prompt-Engineering]]:AI 图像生成提示词工程的核心方法论 - [[Five-Layer-Prompt-Structure]]:主体描述层 → 环境设定层 → 光线规范层 → 摄影技术层 → 风格美学层 - [[Photography-Prompt-Mastery]]:将摄影专业知识转化为 AI 可理解提示词的能力 - [[Platform-Specific-Prompt-Optimization]]:针对不同 AI 图像平台(Midjourney/DALL-E/Stable Diffusion/Flux)的定制化提示词策略 - [[Negative-Prompts]]:负向提示词,排除不想要的图像元素 - [[Film-Emulation]]:胶片模拟风格提示词(Kodak Portra/Fuji Velvia/Ilford HP5/Cinestill 800T) - [[Lighting-Patterns]]:摄影布光模式(Rembrandt/Butterfly/Split/Chiaroscuro/Vermeer/Neon-Noir) ## Key Entities - [[Midjourney]]:AI 图像生成平台,以参数化提示词(--ar/--v/--style/--chaos)著称 - [[DALL-E]]:OpenAI 的 AI 图像生成工具,擅长自然语言描述和风格混合 - [[Stable-Diffusion]]:开源 AI 图像生成平台,支持 token 加权和 embedding 引用 - [[Flux]]:以详细自然语言描述和照片级写实风格著称的新兴 AI 平台 - [[Annie Leibovitz]]:时尚/人像摄影大师,其风格常被引用为提示词参考 - [[Peter Lindbergh]]:经典黑白人像摄影大师,其极简风格常被引用为提示词参考 - [[The Agency]]:多智能体框架,本智能体隶属 Design 设计部门 ## Connections - [[design-ui-designer]] ← shares_design_domain ← [[design-image-prompt-engineer]] - [[design-brand-guardian]] ← brand_consistency ← [[design-image-prompt-engineer]] - [[design-whimsy-injector]] ← visual_language ← [[design-image-prompt-engineer]] - [[design-ux-researcher]] ← visual_validation ← [[design-image-prompt-engineer]] - [[ArchitectUX]] ← design_system ← [[design-image-prompt-engineer]] - [[Multi-Agent-System-Reliability]] ← context ← [[The Agency]] agent ecosystem ## Contradictions - 与 [[design-ui-designer]] 在视觉一致性上的差异: - 冲突点:UI Designer 追求像素级精确还原(95%+ 准确率),Image Prompt Engineer 的输出本质上是概率生成,存在固有不确定性 - 当前观点:Image Prompt Engineer 的目标不是像素级还原,而是 90%+ 视觉概念还原;概率性是 AI 图像生成的本质约束 - 对方观点:UI Designer 要求 95%+ 实现准确率,将提示词视为"设计到代码"的翻译环节 - 协调方案:两者协同时,Image Prompt Engineer 应提供多版本变体供 UI Designer 选择,并在提示词中增加确定性约束(如具体颜色值、光照参数)