Update nexus wiki content

This commit is contained in:
2026-05-03 05:42:06 +08:00
parent 90f3811b83
commit 111bc65b7b
707 changed files with 32306 additions and 7289 deletions

View File

@@ -1,59 +1,65 @@
---
title: "Image Prompt Engineer Agent"
title: "Image Prompt Engineer Agent Personality"
type: source
tags: []
date: 2026-04-20
tags: [ai-agent, design, prompt-engineering, photography, the-agency]
date: 2026-05-15
---
## Source File
- [[raw/Agent/agency-agents/design/design-image-prompt-engineer.md]]
- [[Agent/agency-agents/design/design-image-prompt-engineer]]
## Summary用中文描述
- 核心主题AI 图像生成提示词工程专家智能体,专注于将视觉概念精准翻译为可执行的提示词语言
- 问题域:如何让 AI 图像生成工具(Midjourney/DALL-E/Stable Diffusion/Flux)稳定产出专业级摄影作品
- 方法/机制:五层提示词结构框架(主体描述 → 环境设定 → 光线规范 → 摄影技术 → 风格美学)+ 平台特定语法优化 + 体裁专属提示模式
- 结论/价值:通过结构化的摄影专业知识与 AI 提示词语言的融合,实现 90%+ 的视觉概念还原率,减少迭代次数,提升商业可用性
- **核心主题**AI 图像生成提示词工程专家 Agent——将视觉概念精准翻译为结构化提示词语言驱动 MidjourneyDALL-EStable DiffusionFlux 等平台产出专业级摄影作品
- **问题域**AI 图像生成中的提示词不精确、无结构、术语错误等问题;摄影师和 AI 模型之间的"语言鸿沟"
- **方法/机制**:五层提示词结构框架(主体 → 环境 → 光线 → 摄影技术 → 风格)+ 体裁专属模板(人像/产品/风光/时尚)+ 平台特定语法优化
- **结论/价值**:结构化提示词 + 摄影精确术语 = 90%+ 视觉概念还原率Midjourney/DALL-E/SD/Flux 各有专属语法;负向提示词是可控生成的关键工具
## Key Claims用中文描述
- 五层提示词结构(主体/环境/光线/技术/风格)确保 AI 生成图像与视觉概念高度一致
- 摄影技术术语(如 f/1.8 bokeh、浅景深比模糊描述如"背景模糊")产生更精确的 AI 输出
- 负向提示词negative prompts在支持平台上可有效排除不想要的元素
- 提示词框架应适配不同 AI 平台的语法偏好Midjourney 参数、DALL-E 自然语言、Stable Diffusion token 加权、Flux 详细描述)
- **主体 + 机制 + 结果**Image Prompt Engineer 使用五层结构化提示词框架 → 将视觉概念分层拆解为标准化描述 → 驱动 AI 模型实现 90%+ 视觉概念还原率
- **主体 + 机制 + 结果**Agent 使用精确摄影术语(如 "f/1.8 bokeh 浅景深" 而非 "背景模糊")→ 消除 AI 模型对模糊描述的歧义 → 技术摄影元素(布光/景深/构图)精准渲染
- **主体 + 机制 + 结果**Agent 包含负向提示词规范 → 主动排除不想要元素 → 减少迭代次数,提升生成结果的可控性
- **主体 + 机制 + 结果**Agent 为四大主流平台Midjourney/DALL-E/SD/Flux提供专属语法和参数优化 → 各平台充分发挥特有能力 → 跨平台一致的专业输出
## Key Quotes
> "Always structure prompts with subject, environment, lighting, style, and technical specs" — 提示词结构五要素
> "Use specific, concrete terminology rather than vague descriptors" — 具体性原则
> "Master the art of translating visual concepts into precise, structured language that produces stunning, professional-quality photography" — 核心使命
> "Always structure prompts with subject, environment, lighting, style, and technical specs" — 五层提示词结构的核心原则
> "Use specific, concrete terminology rather than vague descriptors" — 精确性优先于模糊性
> "Be specific: 'Soft golden hour side lighting creating warm skin tones with gentle shadow gradation' not 'nice lighting'" — 具体性示例
> "You're successful when: Generated images match the intended visual concept 90%+ of the time" — 成功指标定义
## Key Concepts
- [[Prompt-Engineering]]AI 图像生成提示词工程的核心方法论
- [[Five-Layer-Prompt-Structure]]:主体描述层 → 环境设定层 → 光线规范层 → 摄影技术层 → 风格美学层
- [[Photography-Prompt-Mastery]]:将摄影专业知识转化为 AI 可理解提示词的能力
- [[Platform-Specific-Prompt-Optimization]]:针对不同 AI 图像平台Midjourney/DALL-E/Stable Diffusion/Flux的定制化提示词策略
- [[Negative-Prompts]]:负向提示词,排除不想要的图像元素
- [[Film-Emulation]]胶片模拟风格提示词Kodak Portra/Fuji Velvia/Ilford HP5/Cinestill 800T
- [[Lighting-Patterns]]摄影布光模式Rembrandt/Butterfly/Split/Chiaroscuro/Vermeer/Neon-Noir
- [[Five-Layer-Prompt-Structure]]五层提示词结构——主体描述层 → 环境设定层 → 光线规范层 → 摄影技术层 → 风格美学层,是该 Agent 的核心方法论框架
- [[Photography-Terminology]]:专业摄影术语体系——精确描述光线、构图、相机参数和后处理效果的标准化语言,如 Rembrandt Lighting、Butterfly Lighting、Bokeh 等
- [[Negative-Prompting]]:负向提示词——主动指定不想要的内容元素,排除 AI 生成图像中的干扰和缺陷
- [[Platform-Specific-Optimization]]平台特定优化——Midjourney`--ar`/`--v`/多提示词加权、DALL-E自然语言优化、Stable DiffusionToken 加权/Embedding/LoRA、Flux详细自然语言/写实优先)
- [[Genre-Specific-Prompt-Patterns]]体裁专属提示词模板——人像85mm/f/1.4/浅景深、产品Hero Shot/微距/深焦)、风光(广角/深焦/HDR、时尚戏剧光/多样视角
## Key Entities
- [[Midjourney]]AI 图像生成平台,以参数化提示词(--ar/--v/--style/--chaos著称
- [[DALL-E]]OpenAI 的 AI 图像生成工具,擅长自然语言描述和风格混合
- [[Stable-Diffusion]]开源 AI 图像生成平台支持 token 加权和 embedding 引用
- [[Flux]]:以详细自然语言描述和照片级写实风格著称的新兴 AI 平台
- [[Annie Leibovitz]]:时尚/人像摄影大师,其风格常被引用为提示词参考
- [[Peter Lindbergh]]:经典黑白人像摄影大师,其极简风格常被引用为提示词参考
- [[The Agency]]:多智能体框架,本智能体隶属 Design 设计部门
- [[Midjourney]]AI 图像生成平台——支持 `--ar`/`--v`/`--style`/`--chaos`/`--no` 参数和多提示词加权(`::` 语法)
- [[Stable-Diffusion]]AI 图像生成平台——支持 Token 加权、Embedding 引用和 LoRA 集成
- [[DALL-E]]AI 图像生成平台——偏好详细自然语言描述,支持风格混合
- [[Flux]]AI 图像生成平台——对写实摄影有天然优势,偏好详细具体描述
- [[Annie-Leibovitz]]:参考摄影师——戏剧性人像与叙事场景风格
- [[Peter-Lindbergh]]:参考摄影师——自然光黑白、真实质感风格
## Connections
- [[design-ui-designer]] ← shares_design_domain ← [[design-image-prompt-engineer]]
- [[design-brand-guardian]] ← brand_consistency ← [[design-image-prompt-engineer]]
- [[design-whimsy-injector]] ← visual_language ← [[design-image-prompt-engineer]]
- [[design-ux-researcher]] ← visual_validation ← [[design-image-prompt-engineer]]
- [[ArchitectUX]] ← design_system ← [[design-image-prompt-engineer]]
- [[Multi-Agent-System-Reliability]] ← context ← [[The Agency]] agent ecosystem
- [[design-ui-designer]] ← depends_on ← [[design-image-prompt-engineer]]UI Designer 在视觉设计阶段可能调用图像提示词工程能力获取参考图像或 UI 素材图像
- [[design-whimsy-injector]] ← depends_on ← [[design-image-prompt-engineer]]:品牌趣味设计需要视觉图像支撑,提示词工程能力为趣味图像的精准生成提供语言工具
- [[design-brand-guardian]] ← extends ← [[design-image-prompt-engineer]]Brand Guardian 定义的视觉品牌规范通过 Image Prompt Engineer 的提示词框架转化为具体图像
- [[design-visual-storyteller]] ← depends_on ← [[design-image-prompt-engineer]]:视觉叙事中的图像素材通过提示词工程实现精准生成
## Contradictions
- 与 [[design-ui-designer]] 在视觉一致性上的差异:
- 冲突点UI Designer 追求像素级精确还原95%+ 准确率Image Prompt Engineer 的输出本质上是概率生成,存在固有不确定性
- 当前观点Image Prompt Engineer 的目标不是像素级还原,而是 90%+ 视觉概念还原;概率性是 AI 图像生成本质约束
- 对方观点UI Designer 要求 95%+ 实现准确率,将提示词视为"设计到代码"的翻译环节
- 协调方案两者协同时Image Prompt Engineer 应提供多版本变体供 UI Designer 选择,并在提示词中增加确定性约束(如具体颜色值、光照参数)
- 与 [[design-ui-designer]] 冲突:
- **冲突点**精确性要求——UI Designer 要求像素级精确的确定性交付,AI 图像生成本质是概率性过程,存在固有不确定性
- **当前观点**Image Prompt Engineer 通过确定性约束(具体颜色值/光照参数/相机规格)最大化控制力,接受概率性结果的有限不确定性
- **对方观点**UI Designer 追求 95%+ 视觉一致性,可能对 AI 生成的不确定性持保留态度
- **协调方式**UI Designer 在需要 AI 生成图像时,通过 Image Prompt Engineer 提供极其详细的摄影参数约束,将概率空间压缩到可接受范围