---
title: "Image Prompt Engineer Agent Personality"
type: source
tags: [ai-agent, design, prompt-engineering, photography, the-agency]
date: 2026-05-15
---

## Source File
- [[Agent/agency-agents/design/design-image-prompt-engineer]]

## Summary（用中文描述）

- **核心主题**：AI 图像生成提示词工程专家 Agent——将视觉概念精准翻译为结构化提示词语言，驱动 Midjourney、DALL-E、Stable Diffusion、Flux 等平台产出专业级摄影作品
- **问题域**：AI 图像生成中的提示词不精确、无结构、术语错误等问题；摄影师和 AI 模型之间的"语言鸿沟"
- **方法/机制**：五层提示词结构框架（主体 → 环境 → 光线 → 摄影技术 → 风格）+ 体裁专属模板（人像/产品/风光/时尚）+ 平台特定语法优化
- **结论/价值**：结构化提示词 + 摄影精确术语 = 90%+ 视觉概念还原率；Midjourney/DALL-E/SD/Flux 各有专属语法；负向提示词是可控生成的关键工具

## Key Claims（用中文描述）

- **主体 + 机制 + 结果**：Image Prompt Engineer 使用五层结构化提示词框架 → 将视觉概念分层拆解为标准化描述 → 驱动 AI 模型实现 90%+ 视觉概念还原率
- **主体 + 机制 + 结果**：Agent 使用精确摄影术语（如 "f/1.8 bokeh 浅景深" 而非 "背景模糊"）→ 消除 AI 模型对模糊描述的歧义 → 技术摄影元素（布光/景深/构图）精准渲染
- **主体 + 机制 + 结果**：Agent 包含负向提示词规范 → 主动排除不想要元素 → 减少迭代次数，提升生成结果的可控性
- **主体 + 机制 + 结果**：Agent 为四大主流平台（Midjourney/DALL-E/SD/Flux）提供专属语法和参数优化 → 各平台充分发挥特有能力 → 跨平台一致的专业输出

## Key Quotes

> "Always structure prompts with subject, environment, lighting, style, and technical specs" — 五层提示词结构的核心原则

> "Use specific, concrete terminology rather than vague descriptors" — 精确性优先于模糊性

> "Be specific: 'Soft golden hour side lighting creating warm skin tones with gentle shadow gradation' not 'nice lighting'" — 具体性示例

> "You're successful when: Generated images match the intended visual concept 90%+ of the time" — 成功指标定义

## Key Concepts

- [[Five-Layer-Prompt-Structure]]：五层提示词结构——主体描述层 → 环境设定层 → 光线规范层 → 摄影技术层 → 风格美学层，是该 Agent 的核心方法论框架
- [[Photography-Terminology]]：专业摄影术语体系——精确描述光线、构图、相机参数和后处理效果的标准化语言，如 Rembrandt Lighting、Butterfly Lighting、Bokeh 等
- [[Negative-Prompting]]：负向提示词——主动指定不想要的内容元素，排除 AI 生成图像中的干扰和缺陷
- [[Platform-Specific-Optimization]]：平台特定优化——Midjourney（`--ar`/`--v`/多提示词加权）、DALL-E（自然语言优化）、Stable Diffusion（Token 加权/Embedding/LoRA）、Flux（详细自然语言/写实优先）
- [[Genre-Specific-Prompt-Patterns]]：体裁专属提示词模板——人像（85mm/f/1.4/浅景深）、产品（Hero Shot/微距/深焦）、风光（广角/深焦/HDR）、时尚（戏剧光/多样视角）

## Key Entities

- [[Midjourney]]：AI 图像生成平台——支持 `--ar`/`--v`/`--style`/`--chaos`/`--no` 参数和多提示词加权（`::` 语法）
- [[Stable-Diffusion]]：AI 图像生成平台——支持 Token 加权、Embedding 引用和 LoRA 集成
- [[DALL-E]]：AI 图像生成平台——偏好详细自然语言描述，支持风格混合
- [[Flux]]：AI 图像生成平台——对写实摄影有天然优势，偏好详细具体描述
- [[Annie-Leibovitz]]：参考摄影师——戏剧性人像与叙事场景风格
- [[Peter-Lindbergh]]：参考摄影师——自然光黑白、真实质感风格

## Connections

- [[design-ui-designer]] ← depends_on ← [[design-image-prompt-engineer]]：UI Designer 在视觉设计阶段可能调用图像提示词工程能力获取参考图像或 UI 素材图像
- [[design-whimsy-injector]] ← depends_on ← [[design-image-prompt-engineer]]：品牌趣味设计需要视觉图像支撑，提示词工程能力为趣味图像的精准生成提供语言工具
- [[design-brand-guardian]] ← extends ← [[design-image-prompt-engineer]]：Brand Guardian 定义的视觉品牌规范通过 Image Prompt Engineer 的提示词框架转化为具体图像
- [[design-visual-storyteller]] ← depends_on ← [[design-image-prompt-engineer]]：视觉叙事中的图像素材通过提示词工程实现精准生成

## Contradictions

- 与 [[design-ui-designer]] 冲突：
  - **冲突点**：精确性要求——UI Designer 要求像素级精确的确定性交付，AI 图像生成本质是概率性过程，存在固有不确定性
  - **当前观点**：Image Prompt Engineer 通过确定性约束（具体颜色值/光照参数/相机规格）最大化控制力，接受概率性结果的有限不确定性
  - **对方观点**：UI Designer 追求 95%+ 视觉一致性，可能对 AI 生成的不确定性持保留态度
  - **协调方式**：UI Designer 在需要 AI 生成图像时，通过 Image Prompt Engineer 提供极其详细的摄影参数约束，将概率空间压缩到可接受范围