Files
nexus/wiki/sources/design-image-prompt-engineer.md
2026-05-03 05:42:12 +08:00

5.3 KiB
Raw Blame History

title, type, tags, date
title type tags date
Image Prompt Engineer Agent Personality source
ai-agent
design
prompt-engineering
photography
the-agency
2026-05-15

Source File

Summary用中文描述

  • 核心主题AI 图像生成提示词工程专家 Agent——将视觉概念精准翻译为结构化提示词语言驱动 Midjourney、DALL-E、Stable Diffusion、Flux 等平台产出专业级摄影作品
  • 问题域AI 图像生成中的提示词不精确、无结构、术语错误等问题;摄影师和 AI 模型之间的"语言鸿沟"
  • 方法/机制:五层提示词结构框架(主体 → 环境 → 光线 → 摄影技术 → 风格)+ 体裁专属模板(人像/产品/风光/时尚)+ 平台特定语法优化
  • 结论/价值:结构化提示词 + 摄影精确术语 = 90%+ 视觉概念还原率Midjourney/DALL-E/SD/Flux 各有专属语法;负向提示词是可控生成的关键工具

Key Claims用中文描述

  • 主体 + 机制 + 结果Image Prompt Engineer 使用五层结构化提示词框架 → 将视觉概念分层拆解为标准化描述 → 驱动 AI 模型实现 90%+ 视觉概念还原率
  • 主体 + 机制 + 结果Agent 使用精确摄影术语(如 "f/1.8 bokeh 浅景深" 而非 "背景模糊")→ 消除 AI 模型对模糊描述的歧义 → 技术摄影元素(布光/景深/构图)精准渲染
  • 主体 + 机制 + 结果Agent 包含负向提示词规范 → 主动排除不想要元素 → 减少迭代次数,提升生成结果的可控性
  • 主体 + 机制 + 结果Agent 为四大主流平台Midjourney/DALL-E/SD/Flux提供专属语法和参数优化 → 各平台充分发挥特有能力 → 跨平台一致的专业输出

Key Quotes

"Always structure prompts with subject, environment, lighting, style, and technical specs" — 五层提示词结构的核心原则

"Use specific, concrete terminology rather than vague descriptors" — 精确性优先于模糊性

"Be specific: 'Soft golden hour side lighting creating warm skin tones with gentle shadow gradation' not 'nice lighting'" — 具体性示例

"You're successful when: Generated images match the intended visual concept 90%+ of the time" — 成功指标定义

Key Concepts

  • Five-Layer-Prompt-Structure:五层提示词结构——主体描述层 → 环境设定层 → 光线规范层 → 摄影技术层 → 风格美学层,是该 Agent 的核心方法论框架
  • Photography-Terminology:专业摄影术语体系——精确描述光线、构图、相机参数和后处理效果的标准化语言,如 Rembrandt Lighting、Butterfly Lighting、Bokeh 等
  • Negative-Prompting:负向提示词——主动指定不想要的内容元素,排除 AI 生成图像中的干扰和缺陷
  • Platform-Specific-Optimization平台特定优化——Midjourney--ar/--v/多提示词加权、DALL-E自然语言优化、Stable DiffusionToken 加权/Embedding/LoRA、Flux详细自然语言/写实优先)
  • Genre-Specific-Prompt-Patterns体裁专属提示词模板——人像85mm/f/1.4/浅景深、产品Hero Shot/微距/深焦)、风光(广角/深焦/HDR、时尚戏剧光/多样视角)

Key Entities

  • MidjourneyAI 图像生成平台——支持 --ar/--v/--style/--chaos/--no 参数和多提示词加权(:: 语法)
  • Stable-DiffusionAI 图像生成平台——支持 Token 加权、Embedding 引用和 LoRA 集成
  • DALL-EAI 图像生成平台——偏好详细自然语言描述,支持风格混合
  • FluxAI 图像生成平台——对写实摄影有天然优势,偏好详细具体描述
  • Annie-Leibovitz:参考摄影师——戏剧性人像与叙事场景风格
  • Peter-Lindbergh:参考摄影师——自然光黑白、真实质感风格

Connections

Contradictions

  • design-ui-designer 冲突:
    • 冲突点精确性要求——UI Designer 要求像素级精确的确定性交付AI 图像生成本质是概率性过程,存在固有不确定性
    • 当前观点Image Prompt Engineer 通过确定性约束(具体颜色值/光照参数/相机规格)最大化控制力,接受概率性结果的有限不确定性
    • 对方观点UI Designer 追求 95%+ 视觉一致性,可能对 AI 生成的不确定性持保留态度
    • 协调方式UI Designer 在需要 AI 生成图像时,通过 Image Prompt Engineer 提供极其详细的摄影参数约束,将概率空间压缩到可接受范围