Files
nexus/wiki/sources/design-image-prompt-engineer.md
2026-05-03 05:42:12 +08:00

66 lines
5.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "Image Prompt Engineer Agent Personality"
type: source
tags: [ai-agent, design, prompt-engineering, photography, the-agency]
date: 2026-05-15
---
## Source File
- [[Agent/agency-agents/design/design-image-prompt-engineer]]
## Summary用中文描述
- **核心主题**AI 图像生成提示词工程专家 Agent——将视觉概念精准翻译为结构化提示词语言驱动 Midjourney、DALL-E、Stable Diffusion、Flux 等平台产出专业级摄影作品
- **问题域**AI 图像生成中的提示词不精确、无结构、术语错误等问题;摄影师和 AI 模型之间的"语言鸿沟"
- **方法/机制**:五层提示词结构框架(主体 → 环境 → 光线 → 摄影技术 → 风格)+ 体裁专属模板(人像/产品/风光/时尚)+ 平台特定语法优化
- **结论/价值**:结构化提示词 + 摄影精确术语 = 90%+ 视觉概念还原率Midjourney/DALL-E/SD/Flux 各有专属语法;负向提示词是可控生成的关键工具
## Key Claims用中文描述
- **主体 + 机制 + 结果**Image Prompt Engineer 使用五层结构化提示词框架 → 将视觉概念分层拆解为标准化描述 → 驱动 AI 模型实现 90%+ 视觉概念还原率
- **主体 + 机制 + 结果**Agent 使用精确摄影术语(如 "f/1.8 bokeh 浅景深" 而非 "背景模糊")→ 消除 AI 模型对模糊描述的歧义 → 技术摄影元素(布光/景深/构图)精准渲染
- **主体 + 机制 + 结果**Agent 包含负向提示词规范 → 主动排除不想要元素 → 减少迭代次数,提升生成结果的可控性
- **主体 + 机制 + 结果**Agent 为四大主流平台Midjourney/DALL-E/SD/Flux提供专属语法和参数优化 → 各平台充分发挥特有能力 → 跨平台一致的专业输出
## Key Quotes
> "Always structure prompts with subject, environment, lighting, style, and technical specs" — 五层提示词结构的核心原则
> "Use specific, concrete terminology rather than vague descriptors" — 精确性优先于模糊性
> "Be specific: 'Soft golden hour side lighting creating warm skin tones with gentle shadow gradation' not 'nice lighting'" — 具体性示例
> "You're successful when: Generated images match the intended visual concept 90%+ of the time" — 成功指标定义
## Key Concepts
- [[Five-Layer-Prompt-Structure]]:五层提示词结构——主体描述层 → 环境设定层 → 光线规范层 → 摄影技术层 → 风格美学层,是该 Agent 的核心方法论框架
- [[Photography-Terminology]]:专业摄影术语体系——精确描述光线、构图、相机参数和后处理效果的标准化语言,如 Rembrandt Lighting、Butterfly Lighting、Bokeh 等
- [[Negative-Prompting]]:负向提示词——主动指定不想要的内容元素,排除 AI 生成图像中的干扰和缺陷
- [[Platform-Specific-Optimization]]平台特定优化——Midjourney`--ar`/`--v`/多提示词加权、DALL-E自然语言优化、Stable DiffusionToken 加权/Embedding/LoRA、Flux详细自然语言/写实优先)
- [[Genre-Specific-Prompt-Patterns]]体裁专属提示词模板——人像85mm/f/1.4/浅景深、产品Hero Shot/微距/深焦)、风光(广角/深焦/HDR、时尚戏剧光/多样视角)
## Key Entities
- [[Midjourney]]AI 图像生成平台——支持 `--ar`/`--v`/`--style`/`--chaos`/`--no` 参数和多提示词加权(`::` 语法)
- [[Stable-Diffusion]]AI 图像生成平台——支持 Token 加权、Embedding 引用和 LoRA 集成
- [[DALL-E]]AI 图像生成平台——偏好详细自然语言描述,支持风格混合
- [[Flux]]AI 图像生成平台——对写实摄影有天然优势,偏好详细具体描述
- [[Annie-Leibovitz]]:参考摄影师——戏剧性人像与叙事场景风格
- [[Peter-Lindbergh]]:参考摄影师——自然光黑白、真实质感风格
## Connections
- [[design-ui-designer]] ← depends_on ← [[design-image-prompt-engineer]]UI Designer 在视觉设计阶段可能调用图像提示词工程能力获取参考图像或 UI 素材图像
- [[design-whimsy-injector]] ← depends_on ← [[design-image-prompt-engineer]]:品牌趣味设计需要视觉图像支撑,提示词工程能力为趣味图像的精准生成提供语言工具
- [[design-brand-guardian]] ← extends ← [[design-image-prompt-engineer]]Brand Guardian 定义的视觉品牌规范通过 Image Prompt Engineer 的提示词框架转化为具体图像
- [[design-visual-storyteller]] ← depends_on ← [[design-image-prompt-engineer]]:视觉叙事中的图像素材通过提示词工程实现精准生成
## Contradictions
- 与 [[design-ui-designer]] 冲突:
- **冲突点**精确性要求——UI Designer 要求像素级精确的确定性交付AI 图像生成本质是概率性过程,存在固有不确定性
- **当前观点**Image Prompt Engineer 通过确定性约束(具体颜色值/光照参数/相机规格)最大化控制力,接受概率性结果的有限不确定性
- **对方观点**UI Designer 追求 95%+ 视觉一致性,可能对 AI 生成的不确定性持保留态度
- **协调方式**UI Designer 在需要 AI 生成图像时,通过 Image Prompt Engineer 提供极其详细的摄影参数约束,将概率空间压缩到可接受范围