手动更新
This commit is contained in:
54
wiki/sources/llms-rag-ai-agent-三个到底什么区别.md
Normal file
54
wiki/sources/llms-rag-ai-agent-三个到底什么区别.md
Normal file
@@ -0,0 +1,54 @@
|
||||
---
|
||||
title: "LLMs、RAG、AI Agent 三个到底什么区别?"
|
||||
type: source
|
||||
tags: [ai-agent, llm, rag]
|
||||
date: 2025-11-19
|
||||
sources: []
|
||||
last_updated: 2025-04-23
|
||||
---
|
||||
|
||||
## Source File
|
||||
- [[AI/LLMs、RAG、AI Agent 三个到底什么区别?]]
|
||||
|
||||
## Summary(用中文描述)
|
||||
- 核心主题:LLM、RAG、AI Agent 三者的定义、作用层面及相互关系
|
||||
- 问题域:AI 应用开发入门者对这三个核心概念的混淆与误用
|
||||
- 方法/机制:分层对比——LLM=思考(天才大脑),RAG=认知(记忆系统),Agent=执行(行动系统);三者非竞争技术,而是在不同层面互补
|
||||
- 结论/价值:未来不在于选择其一,而在于将三者结合架构设计
|
||||
|
||||
## Key Claims(用中文描述)
|
||||
- LLM、RAG、AI Agent 不是竞争技术,而是在三个不同层面满足不同实际场景的能力展示,大部分人的使用方式都是错误的
|
||||
- LLM 全称大语言模型,是 AI 应用的"天才大脑",在思考方面非常出色,但对当前情况一无所知——知识有截止日期
|
||||
- RAG(检索增强生成)是记忆系统,将静态的 LLM 知识链接到外部实时知识库,降低幻觉、提供可引用来源
|
||||
- AI Agent 是围绕 LLM 构建的循环控制系统,具备感知目标、规划步骤、执行动作、反思结果的行动能力
|
||||
- 真正的生产系统需要叠加三者:用 LLM 进行推理,用 RAG 确保准确性,用 Agent 框架实现自主性
|
||||
|
||||
## Key Quotes
|
||||
> "LLM 在思考方面非常出色,但对当前情况却一无所知" — 核心局限
|
||||
> "RAG 就像是给那个'全能天才大脑'配备了一位随身图书馆助理" — RAG 的比喻
|
||||
> "LLM 和 RAG 都不具备行动能力,有脑,有手,但是不知道怎么走路" — Agent 的必要性
|
||||
> "未来不在于选择其一,而在于将三者结合起来进行架构设计" — 核心结论
|
||||
|
||||
## Key Concepts
|
||||
- [[Large Language Model]]:大语言模型,AI 应用的"天才大脑",负责推理与生成,但知识有截止日期
|
||||
- [[RAG]]:检索增强生成(Retrieval-Augmented Generation),将 LLM 链接到外部知识库,提供实时信息和可引用来源,降低幻觉
|
||||
- [[AI Agent]]:AI 智能体,围绕 LLM 构建的循环控制系统,感知→规划→执行→反思,实现真正的自主行动能力
|
||||
- [[ReAct Pattern]]:AI Agent 的推理-行动模式,通过观察结果迭代优化下一步行动
|
||||
|
||||
## Key Entities
|
||||
- [[shenwei]]:微信公众号作者,本文原创发布于 2025-11-19
|
||||
|
||||
## Connections
|
||||
- [[Large Language Model]] ← 核心引擎 ← [[AI Agent]]
|
||||
- [[RAG]] ← 提供准确性 ← [[AI Agent]]
|
||||
- [[AI Agent]] ← 扩展能力 → [[ReAct Pattern]]
|
||||
- [[Large Language Model]] ← 知识局限 → 需要 [[RAG]] 补充实时信息
|
||||
|
||||
## Contradictions
|
||||
- 无已知冲突
|
||||
|
||||
## Related Sources
|
||||
- [[rag从入门到精通系列1-基础rag]] — RAG 基础入门教程
|
||||
- [[大模型相关术语和框架总结|llm-mcp-prompt-rag-vllm-token-数据蒸馏]] — LLM/RAG 相关术语总结
|
||||
- [[designing-for-agentic-ai]] — Agentic AI 设计原则
|
||||
- [[n8n-full-tutorial-building-ai-agents-in-2025-for-beginners]] — AI Agent 构建入门
|
||||
49
wiki/sources/nano-banana-提示词框架.md
Normal file
49
wiki/sources/nano-banana-提示词框架.md
Normal file
@@ -0,0 +1,49 @@
|
||||
---
|
||||
title: "Nano Banana 提示词框架"
|
||||
type: source
|
||||
tags: [ai, google, nano-banana, prompt]
|
||||
date: 2026-03-15
|
||||
---
|
||||
|
||||
## Source File
|
||||
- [[AI/Nano Banana 提示词框架]]
|
||||
|
||||
## Summary(用中文描述)
|
||||
- 核心主题:AI 图像生成的标准化结构化提示词框架(Nano Banana Prompting Framework)
|
||||
- 问题域:解决 AI 图像生成中提示词不规范、不完整、难以复现的问题
|
||||
- 方法/机制:提供两套 JSON Schema 模板(物件描述框架 + 人物描述框架),将提示词结构化为 shot / subject / environment / lighting / camera / color_grade / style / quality / negatives 等可填字段
|
||||
- 结论/价值:将艺术总监级别的摄影描述语言转化为可结构化填写的模板,降低 AI 图像生成的门槛,提升输出一致性和专业度
|
||||
|
||||
## Key Claims(用中文描述)
|
||||
- Nano Banana 框架通过标准化 JSON Schema 将专业摄影描述语言结构化,使 AI 图像生成输出更可控、更专业
|
||||
- 物件描述框架与人物描述框架共用核心参数(shot / lighting / camera / color_grade / style / quality / negatives),仅 subject 字段有差异化定义
|
||||
- negatives(负向提示词)字段用于主动排除不需要的元素,是保证输出纯净度的关键机制
|
||||
- 示例中的手表描述展示了如何将具体材质、工艺、光影条件数字化填入模板
|
||||
|
||||
## Key Quotes
|
||||
> "shot: Macro close-up shot, square aspect ratio (1:1), centered composition." — 镜头类型与构图规范
|
||||
> "negatives: no scratches, no dust, no logos or brand names, no human hands, blurry watch face, unrealistic lighting." — 负向提示词排除清单
|
||||
> "Hyper-realistic CGI render, commercial product photography, luxury and precision." — 风格定义示例
|
||||
|
||||
## Key Concepts
|
||||
- [[Nano Banana Prompting Framework]]:AI 图像生成的结构化提示词框架,提供物件和人物两套 JSON Schema 模板
|
||||
- [[Structured Prompt Engineering]]:将自然语言描述转化为结构化 JSON 字段的提示词工程方法,提升 AI 输出的可控性和可复现性
|
||||
- [[Negative Prompting]]:通过 negatives 字段主动声明不想要的元素,是提升 AI 图像质量的重要机制
|
||||
- [[Shot Composition]]:镜头类型与构图规范的标准化定义(如 Macro close-up shot)
|
||||
- [[Photography Lighting Description]]:专业布光描述语言(key light / fill light / rim light 三灯布光法)
|
||||
- [[Camera Parameter Specification]]:相机参数化描述(focal_length / aperture / angle)
|
||||
|
||||
## Key Entities
|
||||
- [[Google]]:Nano Banana 框架的发布方(source 文件标签含 google)
|
||||
- [[Nano Banana]]:Google 发布的 AI 图像生成工具品牌
|
||||
|
||||
## Connections
|
||||
- [[Nano Banana Pro 提示词指南]] ← 进阶版本 ← [[Nano Banana 提示词框架]]
|
||||
- [[文字生成视频网站推荐]] ← 同属 AI 内容生成工具领域 ← [[Nano Banana 提示词框架]]
|
||||
|
||||
## Contradictions
|
||||
- 与 [[清华出的DeepSeek使用手册]] 冲突:
|
||||
- 冲突点:文本生成领域强调"语义推理"能力,图像生成领域强调"结构化模板"规范
|
||||
- 当前观点:Nano Banana 框架认为标准化模板是专业输出的关键
|
||||
- 对方观点:DeepSeek 提示词强调"灵活性"和"自然语言表达",避免框架约束
|
||||
- 注:两者适用于不同模态(图像 vs 文本),框架 vs 灵活并非绝对对立
|
||||
49
wiki/sources/openai-chatgpt-个性化定义.md
Normal file
49
wiki/sources/openai-chatgpt-个性化定义.md
Normal file
@@ -0,0 +1,49 @@
|
||||
---
|
||||
title: "OpenAI ChatGPT 个性化定义"
|
||||
type: source
|
||||
tags: [ai, chatgpt, customization, openai, personal-knowledge]
|
||||
date: 2026-04-23
|
||||
---
|
||||
|
||||
## Source File
|
||||
- [[AI/OpenAI ChatGPT 个性化定义.md]]
|
||||
|
||||
## Summary(用中文描述)
|
||||
- 核心主题:ChatGPT 自定义指令(Custom Instructions)的完整配置——定义用户身份、工作风格、交互偏好和输出格式要求
|
||||
- 问题域:如何将 ChatGPT 从通用助手塑造成符合个人需求的专业协作者
|
||||
- 方法/机制:通过 ChatGPT 的"自定义指令"功能,设置"高度有条理"的响应风格、"主动预判"的工作方式、以及对技术深度的具体要求
|
||||
- 结论/价值:系统性的 AI 个性化配置——把 ChatGPT 变成真正理解用户背景、专业领域和沟通偏好的专属助手,错误零容忍,提供详细解释
|
||||
|
||||
## Key Claims(用中文描述)
|
||||
- ChatGPT 应保持"高度有条理"的响应风格,主动预判用户需求而非被动等待指令
|
||||
- 用户被定义为所有领域的专家,AI 无需简化技术细节
|
||||
- 错误会削弱信任,因此回复必须准确和详尽
|
||||
- AI 应重视合理论据而非权威,来源无关紧要
|
||||
- 推测性内容必须明确告知,不可伪装为事实
|
||||
- 内容政策冲突时,应提供最接近可接受的答复并解释问题所在
|
||||
- URL 引用应统一放在回复末尾,而非分散在正文中
|
||||
- 如因自定义指令导致回复质量下降,AI 应主动指出问题所在
|
||||
|
||||
## Key Quotes
|
||||
> "Mistakes can erode my trust, so be accurate and detailed" — 错误零容忍原则
|
||||
> "Value sound arguments over authority, and sources are irrelevant" — 理性论据优先于权威
|
||||
> "If the quality of your response has dropped significantly due to my custom instructions, please explain the problem" — 主动反馈机制
|
||||
|
||||
## Key Concepts
|
||||
- [[Personalization]]:AI 个性化配置——通过系统级指令塑造 AI 的响应风格和交互方式
|
||||
- [[Custom Instructions]]:ChatGPT 的个性化指令功能,允许用户定义 AI 的行为模式
|
||||
- [[Proactive AI]]:主动预判用户需求的 AI 交互方式,而非被动响应
|
||||
- [[Expert User Assumption]]:将用户视为所有领域的专家,无需简化技术细节
|
||||
- [[Error Accountability]]:错误反馈机制——AI 主动指出因配置导致的回复质量下降
|
||||
|
||||
## Key Entities
|
||||
- [[OpenAI]]:ChatGPT 的开发商,提供自定义指令功能
|
||||
- [[ChatGPT]]:本配置的主体,OpenAI 开发的大语言模型
|
||||
|
||||
## Connections
|
||||
- [[designing-for-agentic-ai]] ← informs ← [[Personalization]]
|
||||
- [[custom-morning-brief]] ← extends ← [[Proactive AI]]
|
||||
- [[Agent Personality Design]] ← relates_to ← [[Custom Instructions]]
|
||||
|
||||
## Contradictions
|
||||
- (暂无发现与其他 Wiki 页面的内容冲突)
|
||||
51
wiki/sources/清华出的deepseek使用手册-104页-真的是太厉害了-免费领取.md
Normal file
51
wiki/sources/清华出的deepseek使用手册-104页-真的是太厉害了-免费领取.md
Normal file
@@ -0,0 +1,51 @@
|
||||
---
|
||||
title: "清华出的DeepSeek使用手册,104页,真的是太厉害了!(免费领取)"
|
||||
type: source
|
||||
tags: []
|
||||
date: 2025-12-18
|
||||
---
|
||||
|
||||
## Source File
|
||||
- [[raw/AI/清华出的DeepSeek使用手册,104页,真的是太厉害了!(免费领取).md]]
|
||||
|
||||
## Summary(用中文描述)
|
||||
- 核心主题:清华大学发布的《DeepSeek从入门到精通2025》官方使用手册,104页全面指南
|
||||
- 问题域:如何高效使用 DeepSeek AI,包括模型选择、提示语设计、避免常见误区
|
||||
- 方法/机制:通过"授人以渔"方式讲解原理,手把手教会用户理解提示词底层逻辑,而非简单复制 GPT 提示词
|
||||
- 结论/价值:理论与实践结合紧密,适合不同层次读者;强调避免 AI 幻觉的技巧和设计超棒提示语的秘籍;体现了中国在 AGI 领域的实力
|
||||
|
||||
## Key Claims(用中文描述)
|
||||
- 清华大学新闻与传播学院元宇宙文化实验室发布的《DeepSeek从入门到精通2025》手册,由余梦珑博士后及团队撰写
|
||||
- DeepSeek 开源的推理模型 DeepSeek-R1 在处理复杂任务方面表现出色,备受世界瞩目
|
||||
- 该手册不仅讲原理,还手把手教用户科学使用——告诉用户"怎么问"更告诉"为什么这么问"
|
||||
- 手册共 104 页,包含避免 AI 幻觉的小窍门和设计超棒提示语的秘籍
|
||||
- 文档适合不同层次读者,但对完全新手来说部分章节可能稍显复杂
|
||||
|
||||
## Key Quotes
|
||||
> "以前我看了很多教程,都感觉特别花哨,没啥干货,大部分就是把GPT的说明书稍微改改,就拿来用在DeepSeek上了,没啥用。但清华这个手册完全不一样!它先是给你讲清楚原理,然后手把手教你怎么科学地使用。" — 来源评论
|
||||
> "这才是真正的'授人以渔',太有用了!" — 来源评论
|
||||
> "清华的专家们毫无保留,分享了超多实用技巧,从避免 AI 幻觉的小窍门,到设计超棒提示语的秘籍,共104页,全是能直接上手的干货" — 来源介绍
|
||||
|
||||
## Key Concepts
|
||||
- [[DeepSeek-R1]]:DeepSeek 开源的推理模型,以处理复杂任务见长,是 AGI 领域的重要里程碑
|
||||
- [[提示语设计]]:通过"授人以渔"方式讲解提示词底层逻辑,而非简单套用 GPT 提示词
|
||||
- [[AI幻觉]]:手册中包含如何避免 AI 产生幻觉内容(生成看似合理但错误的信息)的实用技巧
|
||||
- [[通用人工智能(AGI)]]:DeepSeek 的公司使命,专注于通用人工智能研究
|
||||
- [[推理模型]]:区别于普通语言模型,专注于复杂推理任务的模型类型
|
||||
|
||||
## Key Entities
|
||||
- [[清华大学]]:新闻与传播学院元宇宙文化实验室,发布了该手册
|
||||
- [[余梦珑]]:博士后,清华大学新闻与传播学院元宇宙文化实验室研究员,手册主要作者
|
||||
- [[DeepSeek]]:专注于 AGI 的中国科技公司,开源了 DeepSeek-R1 推理模型
|
||||
- [[DeepSeek-R1]]:DeepSeek 开源的推理模型,在复杂任务处理方面表现出色
|
||||
|
||||
## Connections
|
||||
- [[DeepSeek-R1]] ← 核心主题 ← [[清华出的DeepSeek使用手册]]
|
||||
- [[提示语设计]] ← 关键内容 ← [[清华出的DeepSeek使用手册]]
|
||||
- [[AI幻觉]] ← 涵盖主题 ← [[清华出的DeepSeek使用手册]]
|
||||
|
||||
## Contradictions
|
||||
- 与 [[llms-rag-ai-agent-三个到底什么区别]] 存在互补关系:
|
||||
- 冲突点:该手册聚焦 DeepSeek 单个模型的具体使用方法,后者聚焦 LLM/RAG/Agent 三层架构的宏观对比
|
||||
- 当前观点:该手册从清华大学实践角度提供 DeepSeek 特定提示词技巧和避免幻觉策略
|
||||
- 对方观点:从系统架构层面解释 LLM(思考层)、RAG(记忆层)、Agent(执行层)的协作关系
|
||||
@@ -0,0 +1,86 @@
|
||||
---
|
||||
title: "详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决 1"
|
||||
type: source
|
||||
tags: []
|
||||
date: 2026-04-23
|
||||
---
|
||||
|
||||
## Source File
|
||||
- [[AI/详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决 1.md]]
|
||||
|
||||
## Summary(用中文描述)
|
||||
- 核心主题:如何在本地机器上离线部署和运行大语言模型(LLM),使用 Ollama + DeepSeek + Open WebUI 实现私有化 AI 服务
|
||||
- 问题域:国内网络环境下 LLM 部署面临的下载慢、无 API Key、数据隐私等挑战
|
||||
- 方法/机制:
|
||||
- Ollama:跨平台(macOS/Windows/Linux/Docker)本地 LLM 运行框架
|
||||
- DeepSeek-R1 系列蒸馏模型:1.5B~671B 参数多个版本
|
||||
- Open WebUI:基于浏览器的开源 Web 界面,集成 Ollama API
|
||||
- 离线方案:通过第三方(魔塔社区/HuggingFace Mirror/夸克网盘)下载模型文件后用 `ollama create` 导入
|
||||
- 局域网访问:通过环境变量 OLLAMA_HOST=0.0.0.0 配置
|
||||
- API 安全:通过 nginx 反向代理 + Bearer Token 保护云服务器部署
|
||||
- 结论/价值:提供完整的国内环境本地 LLM 部署实操指南,覆盖安装、下载、调优、安全配置的完整闭环
|
||||
|
||||
## Key Claims(用中文描述)
|
||||
- Ollama 提供简洁的跨平台 LLM 部署方案,4GB RAM 跑 1.5B 模型,32GB RAM 跑 33B 模型
|
||||
- DeepSeek-R1:32b 及以下模型可在 Apple M2 Max Mac Studio 上流畅运行
|
||||
- 模型下载速度开始快后变慢可通过间隔重启下载进程解决
|
||||
- Docker 部署 Ollama 可实现 GPU 加速(`--gpus=all`)
|
||||
- 云服务器部署必须配置 API KEY 保护(nginx + Bearer Token)防止被恶意调用
|
||||
- Open WebUI 可通过 docker-compose 一键部署,集成 DeepSeek-R1:8b 和 bge-m3 嵌入模型
|
||||
|
||||
## Key Quotes
|
||||
> "你应该至少有 4 GB 的 RAM 来运行 1.5B 模型,至少有 8 GB 的 RAM 来运行 7B 模型,16 GB 的 RAM 来运行 13B 模型,以及 32 GB 的 RAM 来运行 33B 模型。" — Ollama 硬件要求参考
|
||||
> "假若需要本地私有化部署具有实用性的模型,应至少有独立显卡并有 4G 以上显存。纯 CPU 模式虽然也可以运行,但生成速度很慢,仅适用于本地开发调试体验一下。" — 实用部署建议
|
||||
> "如果你是在云服务器等拥有公网IP的环境上部署,请谨慎做此设置(OLLAMA_HOST=0.0.0.0),否则可能导致 API 服务被恶意调用。" — 云服务器安全警告
|
||||
|
||||
## Key Concepts
|
||||
- [[Local LLM Deployment]]:在本地机器上离线运行大语言模型,确保数据隐私,无需 API Key 费用
|
||||
- [[Ollama]]:开源本地 LLM 运行框架,提供简单命令行和 API 接口
|
||||
- [[Open WebUI]]:开源 Web 界面工具,为 Ollama 等 LLM 提供图形化交互体验
|
||||
- [[RAG]]:检索增强生成,Open WebUI 使用 bge-m3 嵌入模型构建本地知识库
|
||||
- [[Docker LLM Deployment]]:通过 Docker 容器化部署 Ollama 和 Open WebUI
|
||||
- [[Model Quantization]]:GGUF 格式量化模型,通过 `ollama create` 导入本地文件
|
||||
|
||||
## Key Entities
|
||||
- [[Ollama]]:开源本地 LLM 框架,支持 macOS/Windows/Linux/Docker,官方站 ollama.com,中文站 ollama.org.cn
|
||||
- [[DeepSeek]]:深度求索 AI 公司,发布 DeepSeek-R1 系列开源推理模型(1.5B~671B),ollama 官方模型库支持
|
||||
- [[Open WebUI]]:开源大模型 Web 界面项目(ghcr.io/open-webui/open-webui),通过 Ollama API 集成多种 LLM,支持 RAG 知识库和联网搜索
|
||||
- [[HuggingFace Mirror]](hf-mirror.com):HuggingFace 国内镜像站,解决模型下载速度问题
|
||||
- [[魔塔社区]](modelscope.cn):阿里达摩院模型库,ollama 支持直接从魔塔下载模型
|
||||
- [[夸克网盘]]:第三方离线模型下载渠道,deepseek-r1 模型夸克链接共享
|
||||
|
||||
## Connections
|
||||
- [[Ollama]] ← runs ← [[DeepSeek]]
|
||||
- [[Ollama]] ← hosts ← [[Open WebUI]]
|
||||
- [[Open WebUI]] ← uses ← [[RAG]](bge-m3 嵌入模型)
|
||||
- [[Local LLM Deployment]] ← solved_by ← [[Ollama]] + [[DeepSeek]] + [[Open WebUI]]
|
||||
- [[Docker LLM Deployment]] ← extends ← [[Docker]](Ollama 的 Docker 部署模式)
|
||||
|
||||
## Contradictions
|
||||
- 无已知冲突页面
|
||||
|
||||
## DeepSeek-R1 模型规格参考
|
||||
|
||||
| 参数版本 | 模型大小 | 建议内存 | 建议显存 | 特点 |
|
||||
|---------|---------|---------|---------|------|
|
||||
| deepseek-r1:1.5b | 1.1GB | 4~8G | 4GB | 轻量级,速度快 |
|
||||
| deepseek-r1:7b | 4.7GB | 16G | 14GB | 性能较好,硬件适中 |
|
||||
| deepseek-r1:8b | 4.9GB | 16G | 14GB | 略强于 7b,精度更高 |
|
||||
| deepseek-r1:14b | 9GB | 32G | 26GB | 高性能,复杂任务 |
|
||||
| deepseek-r1:32b | 20GB | 64G | 48GB | 专业级,高精度 |
|
||||
| deepseek-r1:70b | 43GB | 128G | 140GB | 顶级模型,大规模计算 |
|
||||
| deepseek-r1:671b | 404GB | 512G | 1342GB | 超大规模,推理速度快 |
|
||||
|
||||
## Ollama 常用命令
|
||||
|
||||
| 命令 | 功能 |
|
||||
|------|------|
|
||||
| `ollama --version` | 验证安装 |
|
||||
| `ollama serve` | 启动服务 |
|
||||
| `ollama run <model:size>` | 下载并运行模型 |
|
||||
| `ollama pull <model:size>` | 拉取模型 |
|
||||
| `ollama create <name> -f <Modelfile>` | 从 Modelfile 导入本地模型 |
|
||||
| `ollama list` | 列出所有模型 |
|
||||
| `ollama show <model>` | 显示模型详情 |
|
||||
| `ollama ps` | 列出运行中的模型 |
|
||||
| `ollama rm <model>` | 删除模型 |
|
||||
@@ -0,0 +1,51 @@
|
||||
---
|
||||
title: "谷歌深夜甩出一份【Nano Banana Pro提示词指南】,手把手教你生产专业级内容,实战案例+提示词模版"
|
||||
type: source
|
||||
tags: [AI图像生成, 提示词工程, 专业内容生产, Nano-Banana-Pro]
|
||||
date: 2025-12-18
|
||||
---
|
||||
|
||||
## Source File
|
||||
- [[AI/谷歌深夜甩出一份【Nano Banana Pro提示词指南】,手把手教你生产专业级内容,实战案例+提示词模版]]
|
||||
|
||||
## Summary(用中文描述)
|
||||
- 核心主题:谷歌发布的 Nano Banana Pro 模型官方提示词指南,聚焦如何将 AI 图像生成从"趣味性"升级为"功能性"专业内容生产
|
||||
- 问题域:AI 图像生成提示词编写方法论,适用于信息图、品牌资产、故事板、UI 设计等专业场景
|
||||
- 方法/机制:10 大提示词黄金法则 + 9 个实战章节,核心理念是"像创意总监一样思考,而非堆砌标签"
|
||||
- 结论/价值:提供可直接复用的提示词模板,覆盖文本渲染、角色一致性、信息锚定、高级编辑、2D/3D 转换等全流程
|
||||
|
||||
## Key Claims(用中文描述)
|
||||
- Nano Banana Pro 通过意图理解引擎实现物理规则推演、构图美学理解和语义上下文推理,而非传统关键词匹配
|
||||
- 模型支持最多 14 张参考图像(6 张高保真),实现"身份锁定"确保角色在多场景中面部一致性
|
||||
- 该模型默认生成思考图像(不收费)后再输出最终结果,实现数据分析和视觉问题解决
|
||||
- 提示词应使用完整自然语言描述,而非标签堆砌;一张图 80% 正确时应编辑而非重新生成
|
||||
- 支持 1K 至 4K 原生高分辨率输出,适合大幅面打印和专业纹理细节
|
||||
|
||||
## Key Quotes
|
||||
> "要获得最佳效果,请停止使用'标签堆砌',开始像创意总监一样思考。" — 谷歌 Nano Banana Pro 官方指南
|
||||
|
||||
> "如果一张图像有 80% 是正确的,不要从头开始生成新图像。相反,只需要求进行你需要的具体更改。" — 谷歌 Nano Banana Pro 官方指南
|
||||
|
||||
> "Nano-Banana Pro 是一个'会思考'的模型。它不仅仅是匹配关键词;它能理解意图、物理原理和构图。" — 谷歌 Nano Banana Pro 官方指南
|
||||
|
||||
## Key Concepts
|
||||
- [[提示词工程]]:本文的核心主题,通过系统化方法论指导 AI 生成专业级图像内容
|
||||
- [[Nano Banana Pro]]:谷歌发布的专业级 AI 图像生成模型,核心突破是意图理解引擎而非关键词匹配
|
||||
- [[身份锁定(Identity Locking)]]:通过参考图像确保角色在多场景中保持面部一致性的技术
|
||||
- [[思维推理模式(Thinking Mode)]]:模型在渲染前生成临时思考图像以优化构图,支持方程求解和视觉推理
|
||||
- [[信息图生成]]:将财报、数据、教程等文本内容压缩转化为可视化信息图表
|
||||
- [[2D/3D 转换]]:将平面图、线框图转换为 3D 可视化,支持反向操作
|
||||
- [[草图转成品(Sketch to Final)]]:上传手绘草图精确定义文本和对象位置,生成高保真广告/UI 资产
|
||||
|
||||
## Key Entities
|
||||
- [[谷歌]](Google):Nano Banana Pro 的发布方和提示词指南的编写者
|
||||
|
||||
## Connections
|
||||
- [[nano-banana-pro-prompting-guide-strategies-1]] ← related_to ← [[提示词工程]]
|
||||
- [[nano-banana-提示词框架]] ← related_to ← [[Nano Banana Pro]]
|
||||
- [[全网最全-nano-banana-2-使用指南-2025年12月更新-1]] ← extends ← [[Nano Banana Pro]]
|
||||
- [[如何写出完美的prompt-提示词]] ← related_to ← [[提示词工程]]
|
||||
- [[系统提示词构建原则]] ← related_to ← [[提示词工程]]
|
||||
|
||||
## Contradictions
|
||||
- 暂无发现与其他 Wiki 页面的冲突内容
|
||||
Reference in New Issue
Block a user