Files
nexus/Clippings/谷歌深夜甩出一份【Nano Banana Pro提示词指南】,手把手教你生产专业级内容,实战案例+提示词模版.md
2026-03-23 20:57:45 +08:00

19 KiB
Raw Blame History

title, source, author, published, created, description, tags
title source author published created description tags
谷歌深夜甩出一份【Nano Banana Pro提示词指南】手把手教你生产专业级内容实战案例+提示词模版 https://mp.weixin.qq.com/s/rqpNx9xx3GDgtTXnqdHDEQ
三次方科技风口
2025-12-18
clippings

原创 三次方科技风口 2025年11月29日 10:53

图片

谷歌“Nano Banana Pro”提示词全解把 AI 玩成 4K 级专业产线

凌晨谷歌生成式AI团队毫无预警地甩出一份提示词手册——《The Complete Guide to Nano Banana Pro: 10 Tips for Professional Asset Production》。核心信息只有一个如何用Nano Banana Pro制作专业级内容~~~

技术范式转移当AI开始“思考”创作

Nano Banana Pro的进化核心在于意图理解引擎的突破。与传统模型的“关键词匹配”机制不同该系统具备

  • 物理规则推演能力(如光影反射逻辑)
  • 构图美学理解(黄金分割/视觉层次)
  • 语义上下文推理(品牌调性/受众定位)

以下是谷歌团队的官方指南:

图片

Nano-Banana Pro 是相对于前代模型的重大飞跃从“趣味性”图像生成转向“功能性”专业资产生产。它在文本渲染、角色一致性、视觉合成、世界知识搜索和高分辨率4K输出方面表现出色。

本文内容概览:

  • 提示词黄金法则
  • 文本渲染、信息图与视觉合成
  • 角色一致性与病毒式缩略图
  • 基于 Google 搜索的信息锚定
  • 高级编辑、修复与着色
  • 维度转换 (2D ↔ 3D)
  • 高分辨率与纹理
  • 思考与推理
  • 一次性故事板与概念艺术
  • 结构控制与布局引导
  • 下一步是什么? 图片

🛑 章节 0提示词黄金法则

Nano-Banana Pro 是一个“会思考”的模型。它不仅仅是匹配关键词它能理解意图、物理原理和构图。要获得最佳效果请停止使用“标签堆砌”例如狗、公园、4k、写实开始像创意总监一样思考。

1、编辑而非重新生成 (Edit, Don't Re-roll)

该模型在理解对话式编辑方面表现出色。如果一张图像有 80% 是正确的,不要从头开始生成新图像。相反,只需要求进行你需要的具体更改。

示例: “这很棒,但请将光线改为日落效果,并将文本改为霓虹蓝色。”

2、使用自然语言和完整句子 (Use Natural Language & Full Sentences)

像向人类艺术家做简报一样与模型对话。使用正确的语法和描述性形容词。

差: “酷车霓虹城市夜晚8k。”

好: “一张电影感的广角镜头,展示一辆未来主义跑车在雨夜中飞驰穿过东京街道。霓虹灯招牌的灯光反射在湿漉漉的路面和跑车的金属底盘上。”

3、具体且具有描述性 (Be Specific and Descriptive)

模糊的提示词会产生通用的结果。定义主体、场景、光线和氛围。

主体:不要说“一个女人”,而要说“一位穿着复古香奈儿风格套装的优雅老妇人”。

材质:描述纹理。“哑光饰面”、“拉丝钢”、“柔软天鹅绒”、“皱纸”。

4、提供上下文“为什么”或“为谁”(Provide Context (The "Why" or "For whom"))

因为模型会“思考”,给它提供上下文有助于它做出合乎逻辑的艺术决策。

示例: “为巴西高端美食食谱创作一张三明治的图像。”(模型将推断出专业的摆盘、浅景深和完美的光线)。

🛑 章节 1 文本渲染、信息图与视觉合成

Nano-Banana Pro 拥有最先进SOTA的能力可渲染清晰易读、风格化的文本并将复杂信息合成为视觉格式。

最佳实践:

  • 压缩 (Compression) 要求模型将密集文本或 PDF “压缩”成视觉辅助工具。
  • 风格 (Style) 明确指定你想要的风格,如“精致的编辑风”、“技术图表”或“手绘白板”效果。
  • 引文 (Quotes) 明确指定你想要的文本,并用引号括起来。

示例提示词:

财报信息图(数据输入)

[输入 Google 最新财报的 PDF]

“生成一张简洁、现代的信息图,总结这份财报中的关键财务亮点。包括‘收入增长’和‘净利润’的图表,并将 CEO 的关键引述高亮显示在一个风格化的引文框中。”

图片

复古信息图

“制作一张关于美国小餐馆历史的复古 1950 年代风格信息图。包含‘食物’、‘点唱机’和‘装饰’等独立版块。确保所有文本清晰易读,并采用符合该时期的风格化设计。”

图片

技术图表:

“创建一张正交蓝图,从平面图、立面图和剖面图描述这座建筑。用技术性建筑字体清晰标注‘北立面’和‘主入口’。格式为 16:9。”

图片

白板总结(教育类):

“将Transformer 神经网络架构的概念总结为一张手绘白板图适用于大学讲座。使用不同颜色的记号笔区分编码器Encoder和解码器Decoder模块并为自注意力Self-Attention前馈网络Feed Forward添加清晰标签。”

图片

🛑 章节2 角色一致性与病毒式缩略图

Nano-Banana Pro 最多支持 14 张参考图像(其中 6 张具有高保真度)。这允许进行“身份锁定 (Identity Locking)”——将特定人物或角色放入新场景中而不会出现面部扭曲。

最佳实践:

  • 身份锁定: 明确说明:“保持人物的面部特征与图像 1 完全一致。”
  • 表情/动作: 描述情绪或姿势的变化,同时保持身份不变。
  • 病毒式构图 一次性将主体与醒目的图形和文本结合起来。

示例提示词:

“病毒式缩略图”(身份 + 文本 + 图形)(The "Viral Thumbnail" (Identity + Text + Graphics))

“使用图像 1 中的人物设计一个病毒式视频缩略图。

面部一致性:保持人物的面部特征与图像 1 完全一致,但将其表情改为兴奋和惊讶。

动作:将人物摆放在画面左侧,手指指向画面右侧。

主体:在右侧放置一张高质量的牛油果吐司美食图片。

图形:添加一个醒目的黄色箭头,连接人物的手指和吐司。

文本在中间叠加巨大的流行风格文字3分钟搞定。使用粗体白色描边和投影效果。

背景:模糊、明亮的厨房背景。高饱和度和对比度。”

图片

“毛绒伙伴”场景(群体一致性)

[输入 3 张不同毛绒玩偶的图像]

“创作一个由 10 个部分组成的搞笑故事,讲述这 3 个毛绒朋友去热带度假的经历。故事全程充满刺激,有情感起伏,并以一个幸福的时刻结束。确保所有 3 个角色的服装和身份保持一致,但他们的表情和角度应在所有 10 张图像中有所变化。确保每张图像中每个角色只出现一次。”

图片

品牌资产生成:

[输入 1 张产品图像]

“创建 9 张惊艳的时尚照片,仿佛出自获奖时尚杂志大片。使用此参考图像作为品牌风格,但在系列中添加细微差别和变化,以传达专业的设计感。请一次生成一张图像,共生成九张。”

图片

🛑 章节3 基于 Google 搜索的信息锚定

Nano-Banana Pro 利用 Google 搜索基于实时数据、时事或事实核查生成图像减少在时效性话题上的幻觉hallucinations

最佳实践:

  • 要求可视化动态数据(天气、股票、新闻)。
  • 模型在生成图像前会“思考”(推理)搜索结果。

示例提示词:

事件可视化 (Event Visualization)

“根据当前的旅行趋势,生成一张关于 2025 年美国国家公园最佳游览时间的信息图。”

图片

🛑 章节3高级编辑、修复与着色

该模型擅长通过对话式提示进行复杂编辑。这包括“图像修补 (In-painting)”(移除/添加对象)、“修复 (Restoration)”(修复老照片)、“着色 (Colorization)”(漫画/黑白照片)和“风格转换 (Style Swapping)”。

最佳实践:

  • 语义指令 你不需要手动绘制遮罩;只需自然地告诉模型要更改什么。
  • 物理理解: 你可以要求进行复杂更改,例如“给这个杯子装满液体”来测试物理生成能力。

示例提示词:

对象移除与图像修补 (Object Removal & In-painting)

“移除这张照片背景中的游客,并用符合周围环境的合理纹理(鹅卵石和店面)填充该空间。”

图片

漫画/连环画着色 (Manga/Comic Colorization)

[输入黑白漫画分镜]

“为这张漫画分镜上色。使用充满活力的动漫风格调色板。确保能量光束上的光照效果呈现发光的霓虹蓝色,角色的服装与其官方配色保持一致。”

图片

本地化(文本翻译 + 文化适配)

[输入伦敦公交车站广告图像]

“采用这个概念并将其本地化到东京场景,包括将标语翻译成日语。将背景改为夜晚繁忙的涩谷街道。”

图片

光线/季节控制 (Lighting/Seasonal Control)

[输入夏季房屋图像]

“将此场景转换为冬季。保持房屋结构完全相同,但在屋顶和院子里添加积雪,并将光线改为寒冷、阴沉的下午光线。”

图片

🛑 章节4维度转换 (2D ↔ 3D:

一项强大的新功能是将 2D 示意图转换为 3D 可视化效果,反之亦然。这非常适合室内设计师、建筑师和表情包创作者。

示例提示词:

2D 平面图转 3D 室内设计板 (2D Floor Plan to 3D Interior Design Board)

“基于上传的 2D 平面图,在一张图像中生成专业的室内设计演示板。

布局:拼贴形式,顶部一张大型主图(客厅区域的广角透视图),下方三张小图(主卧室、家庭办公室和一个 3D 俯视平面图)。

风格:应用现代极简主义风格,所有图像均采用温暖的橡木地板和灰白色墙壁。

质量:照片级真实感渲染,柔和的自然光线。”

图片

2D 转 3D 表情包转换:

“将This is Fine狗表情包转换为照片级真实感的 3D 渲染。保持构图完全相同,但让狗看起来像一个毛绒玩具,让火看起来像真实的火焰。”

图片

🛑 章节5高分辨率与纹理

Nano-Banana Pro 支持原生 1K 至 4K 图像生成。这对于细节纹理或大幅面打印特别有用。

最佳实践:

  • 如果你的 API/界面允许请明确要求高分辨率2K 或 4K
  • 描述高保真细节(瑕疵、表面纹理)。

示例提示词:

4K 纹理生成:

“利用原生高保真输出,打造一个令人惊叹的青苔森林地面的氛围环境。掌控复杂的光照效果和细腻的纹理,确保每一缕苔藓和每一束光线都以适合 4K 壁纸的像素级完美分辨率呈现。”

图片

复杂逻辑(思考模式):

“创建一张超写实的信息图,展示一个解构的精致芝士汉堡,展示烤布里欧面包的纹理、肉饼的焦化外壳以及芝士闪亮的融化状态。为每一层标注其风味特征。”

图片

🛑 章节6思考与推理

Nano-Banana Pro 默认采用“思考”过程,在渲染最终输出前会生成临时的思考图像(不收费),以优化构图。这允许进行数据分析和解决视觉问题。

示例提示词:

解方程 (Solve Equations)

“在白板上解方程 log_{x^2+1}(x^4-1)=2 in C。清晰地展示步骤。”

图片

视觉推理:

“分析这张房间的图像,并生成一张‘之前’的图像,展示该房间在施工期间可能的样子,显示框架和未完成的石膏板。”

图片

🛑 章节7一次性故事板与概念艺术:

你可以无需网格即可生成连续艺术或故事板,确保在单次会话中获得连贯的叙事流。这也常用于“电影概念艺术”(例如,即将上映电影的虚假泄露图)。

示例提示词:

“创作一个引人入胜的 9 部分故事,包含 9 张图像,讲述一个获奖奢华行李箱广告中的一男一女。故事应有情感起伏,以一个展示女性和品牌标志的优雅镜头结束。女性和男性的身份及其着装必须贯穿始终保持一致,但可以且应该从不同的角度和距离展现他们。请一次生成一张图像。确保每张图像均为 16:9 的横向格式。”

图片

🛑 章节9结构控制与布局引导

输入图像不仅限于角色参考或待编辑的主体。你可以使用它们来严格控制最终输出的构图和布局。这对于需要将草图、线框图或特定网格布局转化为精美资产的设计师来说是革命性的。

最佳实践:

  • 草稿与草图: 上传手绘草图以精确定义文本和对象的位置。
  • 线框图: 使用现有布局或线框图的截图来生成高保真 UI 模型。
  • 网格: 使用网格图像强制模型为基于图块的游戏或 LED 显示屏生成资产。

示例提示词:

草图转最终广告 (Sketch to Final Ad)

“根据这张草图,为 [产品] 创建一个广告。”

图片

线框图转 UI 模型 (UI Mockup from Wireframe)

“根据这些指南,为 [产品] 创建一个模型。”

图片

像素艺术与 LED 显示屏 (Pixel Art & LED Displays)

“生成一个独角兽的像素艺术精灵,完美适配这张 64x64 网格图像。使用高对比度颜色。”

(提示:开发人员随后可以编程提取每个单元格的中心颜色,以驱动连接的 64x64 LED 矩阵显示屏)。

图片

精灵图 (Sprites)

“精灵图一个女人在无人机上做后空翻3x3 网格,序列,逐帧动画,正方形宽高比。严格按照所附参考图像的结构。”

(提示:你可以提取每个单元格并制作 GIF 动画)。

图片

—— End ——

免费进入AI 3D创业交流群

图片

媒体商务合作(视频号、小红书、公众号、抖音等)

图片

继续滑动看下一个

三次方AIRX

向上滑动看下一个