Files
nexus/wiki/sources/design-image-prompt-engineer.md
2026-04-25 00:02:50 +08:00

4.2 KiB
Raw Blame History

title, type, tags, date
title type tags date
Image Prompt Engineer Agent source
2026-04-20

Source File

Summary用中文描述

  • 核心主题AI 图像生成提示词工程专家智能体,专注于将视觉概念精准翻译为可执行的提示词语言
  • 问题域:如何让 AI 图像生成工具Midjourney/DALL-E/Stable Diffusion/Flux稳定产出专业级摄影作品
  • 方法/机制:五层提示词结构框架(主体描述 → 环境设定 → 光线规范 → 摄影技术 → 风格美学)+ 平台特定语法优化 + 体裁专属提示模式
  • 结论/价值:通过结构化的摄影专业知识与 AI 提示词语言的融合,实现 90%+ 的视觉概念还原率,减少迭代次数,提升商业可用性

Key Claims用中文描述

  • 五层提示词结构(主体/环境/光线/技术/风格)确保 AI 生成图像与视觉概念高度一致
  • 摄影技术术语(如 f/1.8 bokeh、浅景深比模糊描述如"背景模糊")产生更精确的 AI 输出
  • 负向提示词negative prompts在支持平台上可有效排除不想要的元素
  • 提示词框架应适配不同 AI 平台的语法偏好Midjourney 参数、DALL-E 自然语言、Stable Diffusion token 加权、Flux 详细描述)

Key Quotes

"Always structure prompts with subject, environment, lighting, style, and technical specs" — 提示词结构五要素 "Use specific, concrete terminology rather than vague descriptors" — 具体性原则 "Master the art of translating visual concepts into precise, structured language that produces stunning, professional-quality photography" — 核心使命

Key Concepts

Key Entities

  • MidjourneyAI 图像生成平台,以参数化提示词(--ar/--v/--style/--chaos著称
  • DALL-EOpenAI 的 AI 图像生成工具,擅长自然语言描述和风格混合
  • Stable-Diffusion:开源 AI 图像生成平台,支持 token 加权和 embedding 引用
  • Flux:以详细自然语言描述和照片级写实风格著称的新兴 AI 平台
  • Annie Leibovitz:时尚/人像摄影大师,其风格常被引用为提示词参考
  • Peter Lindbergh:经典黑白人像摄影大师,其极简风格常被引用为提示词参考
  • The Agency:多智能体框架,本智能体隶属 Design 设计部门

Connections

Contradictions

  • design-ui-designer 在视觉一致性上的差异:
    • 冲突点UI Designer 追求像素级精确还原95%+ 准确率Image Prompt Engineer 的输出本质上是概率生成,存在固有不确定性
    • 当前观点Image Prompt Engineer 的目标不是像素级还原,而是 90%+ 视觉概念还原;概率性是 AI 图像生成的本质约束
    • 对方观点UI Designer 要求 95%+ 实现准确率,将提示词视为"设计到代码"的翻译环节
    • 协调方案两者协同时Image Prompt Engineer 应提供多版本变体供 UI Designer 选择,并在提示词中增加确定性约束(如具体颜色值、光照参数)