Files
nexus/wiki/sources/nano-banana-pro-prompting-guide-strategies-1.md
2026-04-19 14:51:38 +08:00

3.3 KiB
Raw Blame History

title, type, tags, date
title type tags date
Nano-Banana Pro 提示词指南与策略 source
2025-12-19

Source File

Summary

  • 核心主题Google Nano-Banana Pro 图像生成模型的专业级提示词设计指南
  • 问题域:如何有效使用 Nano-Banana Pro 进行专业级图像内容生产
  • 方法/机制10大核心能力 + 4条黄金法则
  • 结论/价值:从"fun"图像生成升级到"functional"专业资产生产

Key Claims

  • Nano-Banana Pro 是从"趣味"图像生成向"功能性"专业资产生产的重大飞跃
  • 模型支持最多14张参考图像6张高保真度实现"身份锁定"
  • 模型具备"思考"能力,能理解意图、物理和构图,而非简单匹配关键词

Key Quotes

"Nano-Banana Pro is a 'Thinking' model. It doesn't just match keywords; it understands intent, physics, and composition."

Key Concepts

  • Nano Banana ProGoogle 的专业级图像生成模型具备文本渲染、角色一致性、视觉合成、世界知识搜索和高分辨率4K输出能力
  • 提示语设计:通过精心设计的提示词提升 AI 输出质量的技术
  • 身份锁定 (Identity Locking):通过参考图像保持特定人物或角色在生成新场景时面部特征不变的技术
  • 思维模式 (Thinking Mode)Nano-Banana Pro 默认生成中间思考图像(不收费)来优化构图后再渲染最终输出
  • Google Search Grounding:利用 Google 搜索实现实时数据可视化,减少时效性话题的幻觉
  • 图像修补 (In-painting):通过语义指令移除或添加对象,无需手动遮罩
  • 维度转换2D 与 3D 之间的相互转换,适用于室内设计、建筑、表情包创作

Key Entities

  • Google:开发 Nano-Banana Pro 的公司
  • Google AI StudioGoogle 的 AI 开发平台,支持 Nano-Banana Pro 图像生成

Connections

Contradictions

  • (暂无冲突)

10大核心能力

  1. 文本渲染与信息图表SOTA 级别的文本渲染能力,支持风格化文字和复杂信息可视化
  2. 角色一致性与病毒式缩略图支持14张参考图像实现身份锁定
  3. Google Search 锚定:基于实时数据的图像生成,减少幻觉
  4. 高级编辑、修复与着色:语义化指令进行图像处理
  5. 维度转换 (2D ↔ 3D)平面图转3D可视化或反之
  6. 高分辨率与纹理原生支持1K-4K分辨率输出
  7. 思考与推理:通过中间思考图像优化构图
  8. 单次故事板与概念艺术:生成连续艺术或故事板
  9. 结构控制与布局引导:通过草图、线框图控制最终输出
  10. 后续发展UI 实验、App Gallery、AI Studio Build

4条黄金法则

  1. 编辑而非重新生成图像80%正确时不重新生成,通过对话修改
  2. 使用自然语言与完整句子:像 briefing 人类艺术家一样描述
  3. 具体且具描述性:定义主体、材质、纹理、环境、光线、情绪
  4. 提供上下文:告诉模型"为什么"或"为谁"创作