nexus/wiki/sources/design-image-prompt-engineer.md

---
title: "Image Prompt Engineer Agent"
type: source
tags: []
date: 2026-04-20
---

## Source File
- [[raw/Agent/agency-agents/design/design-image-prompt-engineer.md]]

## Summary（用中文描述）
- 核心主题：AI 图像生成提示词工程专家智能体，专注于将视觉概念精准翻译为可执行的提示词语言
- 问题域：如何让 AI 图像生成工具（Midjourney/DALL-E/Stable Diffusion/Flux）稳定产出专业级摄影作品
- 方法/机制：五层提示词结构框架（主体描述 → 环境设定 → 光线规范 → 摄影技术 → 风格美学）+ 平台特定语法优化 + 体裁专属提示模式
- 结论/价值：通过结构化的摄影专业知识与 AI 提示词语言的融合，实现 90%+ 的视觉概念还原率，减少迭代次数，提升商业可用性

## Key Claims（用中文描述）
- 五层提示词结构（主体/环境/光线/技术/风格）确保 AI 生成图像与视觉概念高度一致
- 摄影技术术语（如 f/1.8 bokeh、浅景深）比模糊描述（如"背景模糊"）产生更精确的 AI 输出
- 负向提示词（negative prompts）在支持平台上可有效排除不想要的元素
- 提示词框架应适配不同 AI 平台的语法偏好（Midjourney 参数、DALL-E 自然语言、Stable Diffusion token 加权、Flux 详细描述）

## Key Quotes
> "Always structure prompts with subject, environment, lighting, style, and technical specs" — 提示词结构五要素
> "Use specific, concrete terminology rather than vague descriptors" — 具体性原则
> "Master the art of translating visual concepts into precise, structured language that produces stunning, professional-quality photography" — 核心使命

## Key Concepts
- [[Prompt-Engineering]]：AI 图像生成提示词工程的核心方法论
- [[Five-Layer-Prompt-Structure]]：主体描述层 → 环境设定层 → 光线规范层 → 摄影技术层 → 风格美学层
- [[Photography-Prompt-Mastery]]：将摄影专业知识转化为 AI 可理解提示词的能力
- [[Platform-Specific-Prompt-Optimization]]：针对不同 AI 图像平台（Midjourney/DALL-E/Stable Diffusion/Flux）的定制化提示词策略
- [[Negative-Prompts]]：负向提示词，排除不想要的图像元素
- [[Film-Emulation]]：胶片模拟风格提示词（Kodak Portra/Fuji Velvia/Ilford HP5/Cinestill 800T）
- [[Lighting-Patterns]]：摄影布光模式（Rembrandt/Butterfly/Split/Chiaroscuro/Vermeer/Neon-Noir）

## Key Entities
- [[Midjourney]]：AI 图像生成平台，以参数化提示词（--ar/--v/--style/--chaos）著称
- [[DALL-E]]：OpenAI 的 AI 图像生成工具，擅长自然语言描述和风格混合
- [[Stable-Diffusion]]：开源 AI 图像生成平台，支持 token 加权和 embedding 引用
- [[Flux]]：以详细自然语言描述和照片级写实风格著称的新兴 AI 平台
- [[Annie Leibovitz]]：时尚/人像摄影大师，其风格常被引用为提示词参考
- [[Peter Lindbergh]]：经典黑白人像摄影大师，其极简风格常被引用为提示词参考
- [[The Agency]]：多智能体框架，本智能体隶属 Design 设计部门

## Connections
- [[design-ui-designer]] ← shares_design_domain ← [[design-image-prompt-engineer]]
- [[design-brand-guardian]] ← brand_consistency ← [[design-image-prompt-engineer]]
- [[design-whimsy-injector]] ← visual_language ← [[design-image-prompt-engineer]]
- [[design-ux-researcher]] ← visual_validation ← [[design-image-prompt-engineer]]
- [[ArchitectUX]] ← design_system ← [[design-image-prompt-engineer]]
- [[Multi-Agent-System-Reliability]] ← context ← [[The Agency]] agent ecosystem

## Contradictions
- 与 [[design-ui-designer]] 在视觉一致性上的差异：
  - 冲突点：UI Designer 追求像素级精确还原（95%+ 准确率），Image Prompt Engineer 的输出本质上是概率生成，存在固有不确定性
  - 当前观点：Image Prompt Engineer 的目标不是像素级还原，而是 90%+ 视觉概念还原；概率性是 AI 图像生成的本质约束
  - 对方观点：UI Designer 要求 95%+ 实现准确率，将提示词视为"设计到代码"的翻译环节
  - 协调方案：两者协同时，Image Prompt Engineer 应提供多版本变体供 UI Designer 选择，并在提示词中增加确定性约束（如具体颜色值、光照参数）