From b78ac81f2cb0c4b57be4f37fdc9af001b30d5bcf Mon Sep 17 00:00:00 2001 From: weishen Date: Sat, 18 Apr 2026 03:18:06 +0800 Subject: [PATCH] Auto-sync: 2026-04-18 03:18 --- wiki/concepts/AI代理.md | 26 +++++---- wiki/concepts/LLM.md | 36 +++++++++++++ wiki/concepts/Nano-Banana-Pro.md | 28 ++++++++++ wiki/concepts/RAG.md | 27 ++++++---- wiki/concepts/个性化配置.md | 28 ++++++++++ wiki/concepts/人物描述框架.md | 36 +++++++++++++ wiki/concepts/信息锚定.md | 21 ++++++++ wiki/concepts/图像修补.md | 20 +++++++ wiki/concepts/提示词黄金法则.md | 24 +++++++++ wiki/concepts/提示语设计.md | 28 ++++++++++ wiki/concepts/文本渲染.md | 25 +++++++++ wiki/concepts/物件描述框架.md | 37 +++++++++++++ wiki/concepts/自定义指令.md | 28 ++++++++++ wiki/concepts/角色一致性.md | 24 +++++++++ wiki/entities/ChatGPT.md | 17 ++++++ wiki/entities/DeepSeek.md | 17 ++++++ wiki/entities/Google.md | 24 +++++++++ wiki/entities/Midjourney.md | 16 ++++++ wiki/entities/Ollama.md | 48 +++++++++++++++++ wiki/entities/Open-WebUI.md | 31 +++++++++++ wiki/entities/OpenAI.md | 26 +++++++++ wiki/entities/Qwen.md | 17 ++++++ wiki/entities/Stable-Diffusion.md | 17 ++++++ wiki/entities/余梦珑.md | 18 +++++++ wiki/entities/清华大学.md | 17 ++++++ wiki/index.md | 28 +++++++++- wiki/log.md | 54 +++++++++++++++++++ wiki/overview.md | 4 ++ ...G-AI-Agent-san-ge-dao-di-shen-me-qu-bie.md | 53 ++++++++++++++++++ wiki/sources/Nano-Banana-提示词框架.md | 40 ++++++++++++++ wiki/sources/OpenAI-ChatGPT-个性化定义.md | 43 +++++++++++++++ .../google-nano-banana-pro-prompt-guide.md | 47 ++++++++++++++++ ...DeepSeek使用手册104页真的是太厉害了免费领取.md | 46 ++++++++++++++++ ...ma-deepseek-open-webui安装使用方法及常见问题解决.md | 51 ++++++++++++++++++ 34 files changed, 981 insertions(+), 21 deletions(-) create mode 100644 wiki/concepts/LLM.md create mode 100644 wiki/concepts/Nano-Banana-Pro.md create mode 100644 wiki/concepts/个性化配置.md create mode 100644 wiki/concepts/人物描述框架.md create mode 100644 wiki/concepts/信息锚定.md create mode 100644 wiki/concepts/图像修补.md create mode 100644 wiki/concepts/提示词黄金法则.md create mode 100644 wiki/concepts/提示语设计.md create mode 100644 wiki/concepts/文本渲染.md create mode 100644 wiki/concepts/物件描述框架.md create mode 100644 wiki/concepts/自定义指令.md create mode 100644 wiki/concepts/角色一致性.md create mode 100644 wiki/entities/ChatGPT.md create mode 100644 wiki/entities/DeepSeek.md create mode 100644 wiki/entities/Google.md create mode 100644 wiki/entities/Midjourney.md create mode 100644 wiki/entities/Ollama.md create mode 100644 wiki/entities/Open-WebUI.md create mode 100644 wiki/entities/OpenAI.md create mode 100644 wiki/entities/Qwen.md create mode 100644 wiki/entities/Stable-Diffusion.md create mode 100644 wiki/entities/余梦珑.md create mode 100644 wiki/entities/清华大学.md create mode 100644 wiki/sources/LLMs-RAG-AI-Agent-san-ge-dao-di-shen-me-qu-bie.md create mode 100644 wiki/sources/Nano-Banana-提示词框架.md create mode 100644 wiki/sources/OpenAI-ChatGPT-个性化定义.md create mode 100644 wiki/sources/google-nano-banana-pro-prompt-guide.md create mode 100644 wiki/sources/清华出的DeepSeek使用手册104页真的是太厉害了免费领取.md create mode 100644 wiki/sources/详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决.md diff --git a/wiki/concepts/AI代理.md b/wiki/concepts/AI代理.md index 68445669..2e0f0faf 100644 --- a/wiki/concepts/AI代理.md +++ b/wiki/concepts/AI代理.md @@ -2,25 +2,31 @@ title: "AI代理(Agent)" type: concept tags: [ai, cursor, agent] -date: 2026-04-17 +date: 2026-04-18 --- ## Definition -基于 AI 模型的自动化任务助手,可以按模式生成代码、规划任务或回答问题。在 Cursor 中,AI 代理有三种模式:Plan(规划)、Agent(执行)、Ask(咨询)。 +具备自主决策和任务执行能力的 AI 系统,围绕 LLM 构建循环控制系统,能够感知目标、规划步骤、执行动作、并能够反思结果。 -## Context -- Cursor 中的 AI 代理 +## Core Capability +AI Agent = 思考(LLM)+ 认知(RAG)+ 行动,三者的组合实现真正的自主性。 -## Key Modes +## Agent Loop(代理循环) +AI Agent 通过五步循环实现其目标: + +1. **获取任务**:由具体且高层次的目标启动,可由用户或自动触发机制激活 +2. **扫描场景**:感知环境获取上下文信息,协调层访问可用资源(用户请求、记忆、工具) +3. **仔细思考**:核心"思考"循环,由推理模型驱动,将任务与场景分析并制定行动计划 +4. **采取行动**:编排层执行计划的具体操作,选择并调用适当的工具(API、代码函数、数据库查询) +5. **观察并迭代**:观察行动结果,将新信息添加到上下文或记忆中,然后回到步骤3继续循环 + +## Usage in Cursor - **Plan 模式**:生成计划,不修改代码 - **Agent 模式**:执行计划,会修改代码文件 - **Ask 模式**:仅返回文本答案,不改动文件 -## Usage -1. Plan 模式用于生成开发计划 -2. Agent 模式用于实际代码生成 -3. Ask 模式用于咨询问题,安全无副作用 - ## Related Concepts +- [[LLM]]:负责推理和思考 +- [[RAG]]:负责提供实时外部知识 - [[Plan Mode]]:方案预览模式 - [[Build Mode]]:实际执行模式 \ No newline at end of file diff --git a/wiki/concepts/LLM.md b/wiki/concepts/LLM.md new file mode 100644 index 00000000..c70fc74b --- /dev/null +++ b/wiki/concepts/LLM.md @@ -0,0 +1,36 @@ +--- +title: "LLM" +type: concept +tags: [llm, ai, 大语言模型] +date: 2026-04-18 +--- + +## Definition +大型语言模型(Large Language Model),AI 应用的"天才大脑",学习了过去上下五千年的所有知识,擅长思考和推理,但对当前情况一无所知。 + +## Core Characteristics +- **知识截止时间**:LLM 的知识有训练数据的时间节点限制,例如 ChatGPT-5 的知识截止到 2024 年 6 月 +- **静态知识**:只能回答训练数据范围内的问题,无法直接获取实时信息 +- **推理能力**:在思考方面非常出色,可以帮助写文章、分析问题、编程、画画等 + +## LLM Types +- **底座大模型(Base Model)**:通用模型,如 ChatGPT、DeepSeek、Qwen +- **专有模型(Specialized Model)**:专项训练的模型,如: + - 绘画模型:Midjourney、Stable Diffusion、Flux + - 编程模型:Claude、Cursor + +## Limitations +1. 无法直接获取实时信息 +2. 对当前情况一无所知 +3. 可能产生幻觉(胡编乱造) + +## Solution: Combine with RAG and Agent +最佳实践架构: +- **LLM**:用于思考和推理 +- **RAG**:用于提供实时外部知识(认知) +- **Agent**:用于自主决策和执行 + +## Related Concepts +- [[RAG]]:为 LLM 提供外部实时知识 +- [[AI代理]]:基于 LLM 构建的自主行动系统 +- [[向量数据库]]:RAG 系统的基础设施 \ No newline at end of file diff --git a/wiki/concepts/Nano-Banana-Pro.md b/wiki/concepts/Nano-Banana-Pro.md new file mode 100644 index 00000000..6f90403c --- /dev/null +++ b/wiki/concepts/Nano-Banana-Pro.md @@ -0,0 +1,28 @@ +--- +title: "Nano Banana Pro" +type: concept +tags: [ai, image-generation] +sources: [google-nano-banana-pro-prompt-guide.md] +last_updated: 2025-12-18 +--- + +## Summary +Google 生成式 AI 团队发布的专业级图像生成模型,从"趣味性"图像生成转向"功能性"专业资产生产。支持文本渲染、角色一致性、视觉合成、世界知识(搜索)和高分辨率(4K)输出。 + +## Key Capabilities +- **意图理解引擎**:物理规则推演、构图美学理解、语义上下文推理 +- **文本渲染**:SOTA 级别的清晰易读、风格化文本渲染 +- **角色一致性**:最多 14 张参考图像(6 张高保真度),身份锁定 +- **信息锚定**:利用 Google 搜索,基于实时数据生成图像 +- **高级编辑**:语义指令进行复杂编辑(图像修补、着色、风格转换) +- **维度转换**:2D 示意图与 3D 可视化之间的转换 +- **高分辨率**:原生 1K 至 4K 图像生成 +- **思考模式**:渲染前生成临时思考图像优化构图 + +## Connections +- [[Google]] ← publishes +- [[提示词黄金法则]] ← applies to +- [[文本渲染]] ← capability of +- [[角色一致性]] ← capability of +- [[信息锚定]] ← capability of +- [[4K分辨率]] ← supports \ No newline at end of file diff --git a/wiki/concepts/RAG.md b/wiki/concepts/RAG.md index 1810b791..20461246 100644 --- a/wiki/concepts/RAG.md +++ b/wiki/concepts/RAG.md @@ -1,23 +1,30 @@ --- title: "RAG" type: concept -tags: [] +tags: [llm, rag, ai] +date: 2026-04-18 --- ## Description -检索增强生成(Retrieval-Augmented Generation),结合知识库检索和 AI 生成答案的技术框架。 +检索增强生成(Retrieval-Augmented Generation),为 LLM 提供外部实时知识的机制,被誉为 LLM 的"随身图书馆助理"。 + +## Core Problem +LLM 只能回答训练数据截止时间之前的问题,对实时信息一无所知。LLM 在思考方面非常出色,但对当前情况却一无所知。 ## Key Components -- 知识库索引:文档向量化存储 -- 检索模块:根据查询找到相关上下文 -- 生成模块:基于检索内容生成答案 -- 引用机制:提供答案的来源引用 +- **检索(Retrieval)**:从外部知识库(向量数据库、知识图谱、公司内部文档等)检索最相关的信息块 +- **增强生成(Augmented Generation)**:将检索到的内容作为上下文输入 LLM,指示其基于这些上下文生成答案 -## Use Cases -- 文档问答 -- 知识管理 -- 研究辅助 +## Key Benefits +1. **知识更新与定制**:无需重新训练 LLM 即可获取最新信息 +2. **消除幻觉**:通过提供事实依据,极大降低 LLM 胡编乱造的风险 +3. **引用来源**:可提供信息来源链接或文档页码,增加可信度 + +## Related Technologies +- [[向量数据库]]:存储和检索知识的技术 +- [[NL2SQL]]:自然语言转 SQL,使 Agent 能直接查询数据库 ## Connections +- 依赖 [[LLM]] 进行答案生成 - 与 [[开源平替]] 结合实现私有化部署 - 使用 [[语义搜索]] 提高检索精度 \ No newline at end of file diff --git a/wiki/concepts/个性化配置.md b/wiki/concepts/个性化配置.md new file mode 100644 index 00000000..448e12b6 --- /dev/null +++ b/wiki/concepts/个性化配置.md @@ -0,0 +1,28 @@ +--- +title: "个性化配置" +type: concept +tags: [ai, customization, user-preference] +date: 2026-04-18 +--- + +## Definition +用户根据自身背景、需求和偏好,对 AI 产品进行定制化设置的过程,旨在获得更符合个人需求的交互体验。 + +## Components +- **身份背景**:用户的年龄、职业、专业背景 +- **行为偏好**:对 AI 响应的风格、深度、格式要求 +- **专业程度**:用户对不同领域的信息期望(专家级 vs 初学者) +- **信息源偏好**:对来源权威性的态度(重视论证 vs 重视来源) + +## Example +用户(47岁前云服务交付高级经理)配置 ChatGPT: +- 视为所有领域专家,避免启蒙式交互 +- 重视论证质量而非来源权威性 +- 要求高度有条理且详细的响应 +- 明确拒绝道德说教 + +## Related Entities +- [[ChatGPT]]:支持个性化配置的 AI 产品 + +## Related Concepts +- [[自定义指令]]:实现个性化配置的具体功能 \ No newline at end of file diff --git a/wiki/concepts/人物描述框架.md b/wiki/concepts/人物描述框架.md new file mode 100644 index 00000000..9d207625 --- /dev/null +++ b/wiki/concepts/人物描述框架.md @@ -0,0 +1,36 @@ +--- +title: "人物描述框架" +type: concept +tags: [prompt, nano-banana, image-generation] +date: 2026-04-18 +--- + +## Definition +Google Nano Banana 图像生成模型的人物提示词结构化描述模板。 + +## Structure +```json +{ + "shot": "", + "subject": { + "age": "", + "appearance": "", + "pose": "" + }, + "environment": "", + "lighting": "", + "camera": { + "focal_length": "", + "aperture": "", + "angle": "" + }, + "color_grade": "", + "style": "", + "quality": "", + "negatives": "" +} +``` + +## Related Concepts +- [[物件描述框架]] +- [[Camera Config]] \ No newline at end of file diff --git a/wiki/concepts/信息锚定.md b/wiki/concepts/信息锚定.md new file mode 100644 index 00000000..5c34d4ed --- /dev/null +++ b/wiki/concepts/信息锚定.md @@ -0,0 +1,21 @@ +--- +title: "信息锚定" +type: concept +tags: [ai, image-generation] +sources: [google-nano-banana-pro-prompt-guide.md] +last_updated: 2025-12-18 +--- + +## Summary +Nano Banana Pro 利用 Google 搜索,基于实时数据、时事或事实核查生成图像,减少在时效性话题上的 AI 幻觉。 + +## Best Practices +- 要求可视化动态数据(天气、股票、新闻) +- 模型在生成图像前会"思考"搜索结果 + +## Example Use Cases +- "根据当前的旅行趋势,生成一张关于 2025 年美国国家公园最佳游览时间的信息图。" + +## Connections +- [[Nano Banana Pro]] ← implements +- [[AI幻觉]] ← addresses \ No newline at end of file diff --git a/wiki/concepts/图像修补.md b/wiki/concepts/图像修补.md new file mode 100644 index 00000000..b2ef72e5 --- /dev/null +++ b/wiki/concepts/图像修补.md @@ -0,0 +1,20 @@ +--- +title: "图像修补" +type: concept +tags: [ai, image-generation] +sources: [google-nano-banana-pro-prompt-guide.md] +last_updated: 2025-12-18 +--- + +## Summary +Nano Banana Pro 通过语义指令进行复杂编辑的能力,包括对象移除/添加、修复老照片、漫画着色、风格转换。无需手动绘制遮罩,自然语言描述即可完成。 + +## Types +- **对象移除与图像修补**:移除对象并用合理纹理填充 +- **漫画/连环画着色**:为黑白漫画上色,保持角色官方配色 +- **本地化**:文本翻译 + 文化适配场景转换 +- **光线/季节控制**:改变季节、光线效果 + +## Connections +- [[Nano Banana Pro]] ← implements +- [[角色一致性]] ← related to \ No newline at end of file diff --git a/wiki/concepts/提示词黄金法则.md b/wiki/concepts/提示词黄金法则.md new file mode 100644 index 00000000..d04f26fd --- /dev/null +++ b/wiki/concepts/提示词黄金法则.md @@ -0,0 +1,24 @@ +--- +title: "提示词黄金法则" +type: concept +tags: [ai, prompt-engineering] +sources: [google-nano-banana-pro-prompt-guide.md] +last_updated: 2025-12-18 +--- + +## Summary +Google 官方发布的 Nano Banana Pro 提示词设计四原则,用于指导用户像创意总监一样思考而非简单堆砌关键词。 + +## Key Principles +1. **编辑而非重新生成**:保留 80% 正确的基础上进行修改,而非从头生成新图像 +2. **使用自然语言和完整句子**:像向人类艺术家做简报一样与模型对话 +3. **具体且具有描述性**:定义主体、场景、光线和氛围,避免模糊表述 +4. **提供上下文**:说明"为什么"或"为谁",帮助模型做出合乎逻辑的艺术决策 + +## Example +- ❌ 差:"酷车,霓虹,城市,夜晚,8k。" +- ✅ 好:"一张电影感的广角镜头,展示一辆未来主义跑车在雨夜中飞驰穿过东京街道。霓虹灯招牌的灯光反射在湿漉漉的路面和跑车的金属底盘上。" + +## Connections +- [[提示语设计]] ← applies +- [[Nano Banana Pro]] ← implements \ No newline at end of file diff --git a/wiki/concepts/提示语设计.md b/wiki/concepts/提示语设计.md new file mode 100644 index 00000000..0eab0942 --- /dev/null +++ b/wiki/concepts/提示语设计.md @@ -0,0 +1,28 @@ +--- +title: "提示语设计" +type: concept +tags: [AI, 提示工程, DeepSeek] +date: 2026-04-18 +--- + +## Definition +通过精心设计的提示词(Prompt)来引导 AI 模型生成更高质量输出的技术。提示语设计不仅仅是提供任务指令,还包括理解 AI 的工作原理、选择合适的模型、设计有效的提问方式。 + +## Core Principles +- 明确任务目标 +- 提供充分上下文 +- 使用具体示例 +- 设定输出格式 +- 迭代优化提示词 + +## Related Concepts +- [[AI幻觉]]:通过提示语设计可以减少 AI 生成错误内容的概率 +- [[DeepSeek]]:该概念在此文档中有专门的最佳实践指南 +- [[LLM]]:大型语言模型是提示语设计的对象 + +## Application Scenarios +- 文本生成 +- 代码编写 +- 数据分析 +- 创意写作 +- 问题解答 \ No newline at end of file diff --git a/wiki/concepts/文本渲染.md b/wiki/concepts/文本渲染.md new file mode 100644 index 00000000..af477b81 --- /dev/null +++ b/wiki/concepts/文本渲染.md @@ -0,0 +1,25 @@ +--- +title: "文本渲染" +type: concept +tags: [ai, image-generation] +sources: [google-nano-banana-pro-prompt-guide.md] +last_updated: 2025-12-18 +--- + +## Summary +Nano Banana Pro 最先进(SOTA)的能力,可渲染清晰易读、风格化的文本,并将复杂信息合成为视觉格式。 + +## Best Practices +- **压缩**:要求模型将密集文本或 PDF "压缩"成视觉辅助工具 +- **风格**:明确指定风格,如"精致的编辑风"、"技术图表"或"手绘白板"效果 +- **引文**:明确指定文本内容,用引号括起来 + +## Example Use Cases +- 财报信息图 +- 复古风格信息图 +- 技术图表(建筑蓝图) +- 白板总结(教育类) + +## Connections +- [[Nano Banana Pro]] ← enables +- [[4K分辨率]] ← combines with \ No newline at end of file diff --git a/wiki/concepts/物件描述框架.md b/wiki/concepts/物件描述框架.md new file mode 100644 index 00000000..528a8f2f --- /dev/null +++ b/wiki/concepts/物件描述框架.md @@ -0,0 +1,37 @@ +--- +title: "物件描述框架" +type: concept +tags: [prompt, nano-banana, image-generation] +date: 2026-04-18 +--- + +## Definition +Google Nano Banana 图像生成模型的物件提示词结构化描述模板。 + +## Structure +```json +{ + "shot": "", + "subject": { + "item": "", + "materials": "", + "details": "", + "condition": "" + }, + "environment": "", + "lighting": "", + "camera": { + "focal_length": "", + "aperture": "", + "angle": "" + }, + "color_grade": "", + "style": "", + "quality": "", + "negatives": "" +} +``` + +## Related Concepts +- [[人物描述框架]] +- [[Camera Config]] \ No newline at end of file diff --git a/wiki/concepts/自定义指令.md b/wiki/concepts/自定义指令.md new file mode 100644 index 00000000..ea20cbff --- /dev/null +++ b/wiki/concepts/自定义指令.md @@ -0,0 +1,28 @@ +--- +title: "自定义指令" +type: concept +tags: [chatgpt, customization, prompt] +date: 2026-04-18 +--- + +## Definition +用户为 ChatGPT 设置的行为指导原则,通过自定义指令功能配置 AI 的响应风格、偏好和行为方式。 + +## How It Works +用户在 ChatGPT 设置中添加自定义指令,包括两部分: +1. **行为偏好**:期望 AI 如何响应(如"高度有条理"、"提供详细解释") +2. **背景信息**:用户的身份、背景和需求(如专业背景、行业领域) + +## Use Cases +- 配置 AI 响应风格(简洁 vs 详细) +- 设置专业领域偏好(技术/商业/创意) +- 定义信息源偏好(重视论证质量而非来源权威性) +- 控制安全/道德讨论的触发阈值 + +## Related Entities +- [[ChatGPT]]:提供自定义指令功能的 AI 产品 +- [[OpenAI]]:ChatGPT 的开发商 + +## Related Concepts +- [[提示语设计]]:更广泛的 AI 提示工程技术 +- [[个性化配置]]:用户根据自身需求定制 AI 交互方式的过程 \ No newline at end of file diff --git a/wiki/concepts/角色一致性.md b/wiki/concepts/角色一致性.md new file mode 100644 index 00000000..92fb5e1f --- /dev/null +++ b/wiki/concepts/角色一致性.md @@ -0,0 +1,24 @@ +--- +title: "角色一致性" +type: concept +tags: [ai, image-generation] +sources: [google-nano-banana-pro-prompt-guide.md] +last_updated: 2025-12-18 +--- + +## Summary +Nano Banana Pro 支持最多 14 张参考图像(6 张高保真度),实现"身份锁定"技术,将特定人物或角色放入新场景而不会出现面部扭曲。 + +## Implementation +- **身份锁定**:明确说明"保持人物的面部特征与图像 1 完全一致" +- **表情/动作变化**:描述情绪或姿势的变化,同时保持身份不变 +- **病毒式构图**:一次性将主体与醒目的图形和文本结合 + +## Use Cases +- 视频缩略图设计 +- 品牌资产生成(系列图片) +- 故事板创作(多场景保持角色一致) + +## Connections +- [[Nano Banana Pro]] ← implements +- [[图像修补]] ← related to \ No newline at end of file diff --git a/wiki/entities/ChatGPT.md b/wiki/entities/ChatGPT.md new file mode 100644 index 00000000..2af6add6 --- /dev/null +++ b/wiki/entities/ChatGPT.md @@ -0,0 +1,17 @@ +--- +title: "ChatGPT" +type: entity +tags: [openai, llm, ai] +date: 2026-04-18 +--- + +## Description +OpenAI 开发的大型语言模型,底座大模型的代表产品。ChatGPT 是目前最知名的 LLM 之一,广泛用于对话、写作、编程等场景。 + +## Type +- 底座大模型(Base Model) + +## Related Concepts +- [[LLM]]:大型语言模型 +- [[RAG]]:可用于为 ChatGPT 提供外部知识 +- [[AI代理]]:可作为 Agent 的推理引擎 \ No newline at end of file diff --git a/wiki/entities/DeepSeek.md b/wiki/entities/DeepSeek.md new file mode 100644 index 00000000..7d04019b --- /dev/null +++ b/wiki/entities/DeepSeek.md @@ -0,0 +1,17 @@ +--- +title: "DeepSeek" +type: entity +tags: [llm, ai, 中国] +date: 2026-04-18 +--- + +## Description +中国开发的大语言模型,底座大模型的代表产品之一。DeepSeek 以开源和高效著称,在代码生成和数学推理方面表现优异。 + +## Type +- 底座大模型(Base Model) + +## Related Concepts +- [[LLM]]:大型语言模型 +- [[RAG]]:可用于为 DeepSeek 提供外部知识 +- [[AI代理]]:可作为 Agent 的推理引擎 \ No newline at end of file diff --git a/wiki/entities/Google.md b/wiki/entities/Google.md new file mode 100644 index 00000000..98e8d10c --- /dev/null +++ b/wiki/entities/Google.md @@ -0,0 +1,24 @@ +--- +title: "Google" +type: entity +tags: [company, ai] +sources: [] +last_updated: 2025-12-18 +--- + +## Aliases +- 谷歌 +- Google LLC + +## Summary +Google(谷歌)是全球最大的搜索引擎公司,隶属于 Alphabet 集团。在 AI 领域,Google 发布了多项创新产品,包括 Gemini 大模型、Imagen 图像生成模型、Nano Banana 图像生成模型,以及 Nano Banana Pro 提示词指南。 + +## Role +- AI 模型开发商 +- 云服务提供商(GCP) + +## Connections +- [[GCP]] ← provides cloud infrastructure +- [[Google-Sheets]] ← product +- [[YouTube]] ← product +- [[Nicholas-Carlini]] ← Google 研究科学家 \ No newline at end of file diff --git a/wiki/entities/Midjourney.md b/wiki/entities/Midjourney.md new file mode 100644 index 00000000..b905cc8e --- /dev/null +++ b/wiki/entities/Midjourney.md @@ -0,0 +1,16 @@ +--- +title: "Midjourney" +type: entity +tags: [ai, 图像生成, 专有模型] +date: 2026-04-18 +--- + +## Description +专用于图像生成的 AI 模型,基于底座大模型进行专项训练,在艺术风格和细节表现方面著称。 + +## Type +- 专有模型(Specialized Model)- 图像生成 + +## Related Concepts +- [[LLM]]:大型语言模型 +- [[Stable-Diffusion]]:另一个知名的开源图像生成模型 \ No newline at end of file diff --git a/wiki/entities/Ollama.md b/wiki/entities/Ollama.md new file mode 100644 index 00000000..fb4b4643 --- /dev/null +++ b/wiki/entities/Ollama.md @@ -0,0 +1,48 @@ +--- +title: "Ollama" +type: entity +tags: [llm, ai, 开源] +date: 2026-04-18 +--- + +## Aliases +- Ollama +- ollama + +## Description +Ollama 是一个开源的本地大语言模型运行框架,它提供了非常简单便捷的使用形式,让用户可以十分方便的在本地机器上部署和运行大型语言模型,从而实现免费离线的方式使用 LLM 能力,并确保私有数据的隐私和安全性。 + +## Type +- LLM 运行框架 +- 开源软件 + +## Supported Models +- DeepSeek-R1(1.5B、7B、8B、14B、32B、70B、671B) +- Qwen 系列 +- Llama 系列 +- bge-m3(嵌入模型,用于 RAG) + +## Hardware Requirements +- 1.5B 模型:4GB RAM +- 7B 模型:8GB RAM(建议 16GB) +- 13B 模型:16GB RAM(建议 32GB) +- 33B 模型:32GB RAM(建议 64GB) +- GPU:建议 4GB 以上显存 + +## Installation Methods +- 直接安装(Windows/macOS/Linux) +- Docker 容器部署 +- 离线安装 + +## Ports +- API 服务:11434 + +## Related Entities +- [[DeepSeek]]:支持的模型之一 +- [[Open-WebUI]]:可通过配置集成 + +## Related Concepts +- [[LLM]]:大型语言模型 +- [[Docker]]:容器化部署 +- [[RAG]]:检索增强生成 +- [[向量嵌入]]:文本向量化技术 \ No newline at end of file diff --git a/wiki/entities/Open-WebUI.md b/wiki/entities/Open-WebUI.md new file mode 100644 index 00000000..5dacd998 --- /dev/null +++ b/wiki/entities/Open-WebUI.md @@ -0,0 +1,31 @@ +--- +title: "Open WebUI" +type: entity +tags: [] +--- + +## Aliases +- OpenWebUI +- open-webui + +## Description +开源的大语言模型 Web UI 界面项目,提供基于浏览器的图形化界面,可便捷集成 Ollama、OpenAI 等多种 LLM API。 + +## Key Features +- 纯本地运行的基于浏览器访问的 Web 服务 +- 可扩展、功能丰富、用户友好的自托管 AI Web 界面 +- 支持各种大型语言模型运行器 +- 可通过配置形式便捷集成 Ollama、OpenAI 等提供的 API +- 支持聊天机器人、本地知识库、图像生成等丰富的大模型应用功能 +- 支持联网搜索功能(需配置 API KEY) + +## Use Cases +- 聊天机器人 +- 本地知识库(RAG) +- 图像生成 +- 离线 AI 对话 + +## connections +- [[Ollama]]:通过 OLLAMA_API_BASE_URL 配置集成 +- [[DeepSeek]]:支持的模型之一 +- [[RAG]]:本地知识库构建 \ No newline at end of file diff --git a/wiki/entities/OpenAI.md b/wiki/entities/OpenAI.md new file mode 100644 index 00000000..48489d0d --- /dev/null +++ b/wiki/entities/OpenAI.md @@ -0,0 +1,26 @@ +--- +title: "OpenAI" +type: entity +tags: [openai, ai, company] +date: 2026-04-18 +--- + +## Description +OpenAI 是美国人工智能研究实验室,成立于2015年,总部位于旧金山。OpenAI 以开发大型语言模型(如 GPT 系列)和推动 AI 安全研究闻名。主要产品包括 ChatGPT、DALL-E、o1、o3 等。 + +## Founded +2015年 + +## Headquarters +San Francisco, California + +## Products +- [[ChatGPT]]:对话式 AI 助手 +- GPT 系列模型:GPT-4、GPT-4o、o1、o3 +- DALL-E:图像生成模型 +- Sora:视频生成模型 + +## Related Concepts +- [[LLM]]:OpenAI 的核心产品类型 +- [[Agentic AI]]:OpenAI 正在探索的 AI 发展方向 +- [[自定义指令]]:ChatGPT 的个性化配置功能 \ No newline at end of file diff --git a/wiki/entities/Qwen.md b/wiki/entities/Qwen.md new file mode 100644 index 00000000..393bf4d9 --- /dev/null +++ b/wiki/entities/Qwen.md @@ -0,0 +1,17 @@ +--- +title: "Qwen" +type: entity +tags: [llm, ai, 阿里云] +date: 2026-04-18 +--- + +## Description +阿里云开发的大型语言模型,底座大模型的代表产品之一。Qwen(通义千问)在中文理解和多模态能力方面表现突出。 + +## Type +- 底座大模型(Base Model) + +## Related Concepts +- [[LLM]]:大型语言模型 +- [[RAG]]:可用于为 Qwen 提供外部知识 +- [[AI代理]]:可作为 Agent 的推理引擎 \ No newline at end of file diff --git a/wiki/entities/Stable-Diffusion.md b/wiki/entities/Stable-Diffusion.md new file mode 100644 index 00000000..9a5fd744 --- /dev/null +++ b/wiki/entities/Stable-Diffusion.md @@ -0,0 +1,17 @@ +--- +title: "Stable Diffusion" +type: entity +tags: [ai, 图像生成, 开源, 专有模型] +date: 2026-04-18 +--- + +## Description +开源的图像生成模型,专用于图像生成,基于底座大模型进行专项训练。与 Midjourney 并列为最流行的图像生成模型。 + +## Type +- 专有模型(Specialized Model)- 图像生成 +- 开源项目 + +## Related Concepts +- [[LLM]]:大型语言模型 +- [[Midjourney]]:另一个知名的商业图像生成模型 \ No newline at end of file diff --git a/wiki/entities/余梦珑.md b/wiki/entities/余梦珑.md new file mode 100644 index 00000000..7d4004f9 --- /dev/null +++ b/wiki/entities/余梦珑.md @@ -0,0 +1,18 @@ +--- +title: "余梦珑" +type: entity +tags: [人物, 清华大学, 研究人员] +date: 2026-04-18 +--- + +## Description +清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室的博士后,《DeepSeek从入门到精通2025》手册的作者。 + +## Type +- 研究人员 +- AI 领域专家 + +## Related Concepts +- [[提示语设计]]:该作者研究的 AI 工具使用最佳实践 +- [[清华大学]]:作者所属机构 +- [[DeepSeek]]:该作者研究的 AI 模型 \ No newline at end of file diff --git a/wiki/entities/清华大学.md b/wiki/entities/清华大学.md new file mode 100644 index 00000000..f8da7ccf --- /dev/null +++ b/wiki/entities/清华大学.md @@ -0,0 +1,17 @@ +--- +title: "清华大学" +type: entity +tags: [大学, 中国, 教育] +date: 2026-04-18 +--- + +## Description +中国顶尖大学,位于北京。清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室发布了《DeepSeek从入门到精通2025》官方教程。 + +## Type +- 教育机构 +- 研究机构 + +## Related Concepts +- [[提示语设计]]:该机构研究的 AI 工具使用最佳实践 +- [[AI幻觉]]:该教程帮助用户避免的 AI 生成错误问题 \ No newline at end of file diff --git a/wiki/index.md b/wiki/index.md index fedbd36a..a2d3ce8a 100644 --- a/wiki/index.md +++ b/wiki/index.md @@ -139,15 +139,27 @@ - [不谈技术:普通人该怎么在AI时代赚钱?](sources/bu-tan-ji-shu-pu-tong-ren-gai-zen-me-zai-ai-shi-dai-zhuan-qian.md) — AI时代普通人赚钱策略(品味护城河、端到端、死亡过滤器) - [14个免费的AI图生视频工具,用AI让图片动起来](sources/14个免费的AI图生视频工具-yi-ai-rang-tu-pian-dong-qi-lai.md) — 14个免费 AI 图生视频工具评测与推荐(绘蛙、智谱清影、通义万相、Vidu、可灵等) +- [谷歌Nano Banana Pro提示词指南](sources/google-nano-banana-pro-prompt-guide.md) — Google 发布的 Nano Banana Pro 图像生成模型的专业级提示词设计指南(10个专业内容生产技巧、4K 级输出) + +- [Nano Banana 提示词框架](sources/Nano-Banana-提示词框架.md) — Google Nano Banana 图像生成模型的提示词框架(物件描述、人物描述两类结构化 JSON 模板) + - [A Formalization of Recursive Self-Optimizing Generative Systems](sources/a-formalization-of-recursive-self-optimizing-generative-systems.md) — 递归自优化生成系统的形式化定义与不动点结构 +- [详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决](sources/详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决.md) — 本地离线部署 Ollama + DeepSeek + Open-WebUI 全流程指南(Docker 部署、模型离线下载、API 配置) + - [Designing for Agentic AI](sources/designing-for-agentic-ai.md) — AI Agent 产品设计的五大最佳实践(透明度、控制力、个性化、对话、预判) - [Google 神级生产力工具,所有 GitHub 开源平替都找到了](sources/Google-神级生产力工具-所有-GitHub-开源平替都找到了.md) — 7 款 NotebookLM 开源平替工具汇总(Open Notebook、SurfSense、Podcastfy 等) - [文字生成视频网站推荐](sources/文字生成视频网站推荐.md) — 5 款文字生成视频 AI 工具评测(万彩AI、百度AI、Zeemo、Vizard、快影) +- [LLMs、RAG、AI Agent 三个到底什么区别?](sources/LLMs-RAG-AI-Agent-san-ge-dao-di-shen-me-qu-bie.md) — LLM、RAG、AI Agent 三者区别与组合架构(思考用 LLM、认知用 RAG、执行用 Agent) + +- [OpenAI ChatGPT 个性化定义](sources/OpenAI-ChatGPT-个性化定义.md) — ChatGPT 个性化配置与自定义指令设置 + ## Entities +- [清华大学](entities/清华大学.md) — 中国顶尖大学,发布 DeepSeek 官方教程 +- [余梦珑](entities/余梦珑.md) — 清华大学博士后,《DeepSeek从入门到精通2025》手册作者 - [营销人张飞宇](entities/营销人张飞宇.md) — 微信公众号作者,专注于个人品牌、商业变现方法论 - [Mac Mini](entities/Mac-Mini.md) — Apple Mac Mini M4 主控节点,内网 IP 192.168.3.189 - [RackNerd](entities/RackNerd.md) — VPS 服务提供商,提供公网 IP 192.227.222.142 @@ -257,9 +269,21 @@ - [File Explorer Note Count](entities/File-Explorer-Note-Count.md) — Obsidian 文件管理器笔记计数插件 - [Reddit](entities/Reddit.md) — 社交新闻聚合网站,提供子版块热门帖子获取能力 +- [ChatGPT](entities/ChatGPT.md) — OpenAI 开发的大型语言模型,底座大模型代表 +- [OpenAI](entities/OpenAI.md) — 美国 AI 研究实验室,开发 ChatGPT、GPT 系列模型 +- [DeepSeek](entities/DeepSeek.md) — 中国开发的大语言模型,以开源和高效著称 +- [Qwen](entities/Qwen.md) — 阿里云开发的大型语言模型(通义千问) +- [Midjourney](entities/Midjourney.md) — 专用于图像生成的 AI 模型 +- [Stable Diffusion](entities/Stable-Diffusion.md) — 开源的图像生成模型 +- [Ollama](entities/Ollama.md) — 开源本地大语言模型运行框架 +- [Open-WebUI](entities/Open-WebUI.md) — 开源大语言模型 Web UI 界面 + ## Concepts -- [Fallback 机制](concepts/Fallback-机制.md) — 当默认模型不可用时自动切换到备选模型的机制,可能切到更小的模型导致问题 - [主动问责](concepts/主动问责.md) — AI Agent 主动询问用户行为完成情况,通过直接提问促进行为改变 +- [AI幻觉](concepts/AI幻觉.md) — AI 生成看似合理但实际错误的内容,需通过技巧避免 +- [提示语设计](concepts/提示语设计.md) — 通过精心设计的提示词提升 AI 输出质量的技术 +- [自定义指令](concepts/自定义指令.md) — ChatGPT 用户设置的行为指导原则 +- [个性化配置](concepts/个性化配置.md) — 用户根据自身需求定制 AI 交互方式的过程 - [systemd-logind](concepts/systemd-logind.md) — systemd 登录管理器,处理电源管理事件 - [TMUX 交互模式](concepts/TMUX-jiao-hu-mo-shi.md) — Claude Code 在 TMUX 会话中的交互模式,适合超长任务 - [HandleLidSwitch](concepts/HandleLidSwitch.md) — 合盖电源行为配置项 @@ -437,5 +461,7 @@ - [防彈筆記法](concepts/防彈筆記法.md) — 任务导向的知识管理系统(SSOT、目标行动决策同一笔记) - [Generative AI](concepts/Generative-AI.md) — 擅长创建新内容(文本、图像、音乐)的 AI 系统 +- [LLM](concepts/LLM.md) — 大型语言模型,AI 应用的"天才大脑",擅长思考但对当前情况无知 + ## Syntheses - (暂无) diff --git a/wiki/log.md b/wiki/log.md index 49ded43f..589580fb 100644 --- a/wiki/log.md +++ b/wiki/log.md @@ -1,3 +1,57 @@ +## [2026-04-18] ingest | Nano Banana 提示词框架 +- Source file: raw/AI/Nano Banana 提示词框架.md +- Status: ✅ 成功摄入 +- Summary: Google Nano Banana 图像生成模型的提示词框架,包含物件描述和人物描述两类结构化 JSON 模板 +- Concepts created: 物件描述框架(新增), 人物描述框架(新增) +- Entities created: Google(更新) +- Source page: wiki/sources/Nano-Banana-提示词框架.md +- Notes: + +## [2026-04-18] ingest | 详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决 +- Source file: raw/AI/详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决 1.md +- Status: ✅ 成功摄入 +- Summary: 本地离线部署大语言模型运行环境,实现免费私密的 LLM 使用体验。涵盖 Ollama 安装、Docker 部署、模型离线下载、API 配置、Open-WebUI 集成 +- Concepts created: RAG(更新), 向量嵌入(更新) +- Entities created: Ollama(新增), Open-WebUI(新增) +- Source page: wiki/sources/详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决.md +- Notes: + +## [2025-12-18] ingest | 谷歌Nano Banana Pro提示词指南 +- Source file: raw/AI/谷歌深夜甩出一份【Nano Banana Pro提示词指南】,手把手教你生产专业级内容,实战案例+提示词模版.md +- Status: ✅ 成功摄入 +- Summary: Google 发布的 Nano Banana Pro 图像生成模型的专业级提示词设计指南,涵盖10个专业内容生产技巧,实现从"趣味性"到"功能性"的转变 +- Concepts created: 提示词黄金法则(新增), 文本渲染(新增), 角色一致性(新增), 信息锚定(新增), Nano Banana Pro(新增), 图像修补(新增) +- Entities created: Google(新增) +- Source page: wiki/sources/google-nano-banana-pro-prompt-guide.md +- Notes: + +## [2026-04-18] ingest | OpenAI ChatGPT 个性化定义 +- Source file: raw/AI/OpenAI ChatGPT 个性化定义.md +- Status: ✅ 成功摄入 +- Summary: ChatGPT 个性化配置与自定义指令设置,用户背景(47岁前云服务交付高级经理,转型TikTok跨境电商)决定了对 AI 的高标准要求——专业、准确、有深度 +- Concepts created: 自定义指令(新增), 个性化配置(新增) +- Entities created: OpenAI(新增), ChatGPT(更新) +- Source page: wiki/sources/OpenAI-ChatGPT-个性化定义.md +- Notes: + +## [2026-04-18] ingest | 清华出的DeepSeek使用手册,104页,真的是太厉害了!(免费领取) +- Source file: raw/AI/清华出的DeepSeek使用手册,104页,真的是太厉害了!(免费领取).md +- Status: ✅ 成功摄入 +- Summary: 清华大学发布的 DeepSeek 官方教程,104页干货,涵盖提示语设计原理、实战技巧、避免 AI 幻觉策略,帮助用户从入门到精通 +- Concepts created: 提示语设计(新增), AI幻觉(新增) +- Entities created: 清华大学(新增), 余梦珑(新增) +- Source page: wiki/sources/清华出的DeepSeek使用手册104页真的是太厉害了免费领取.md +- Notes: + +## [2026-04-18] ingest | LLMs、RAG、AI Agent 三个到底什么区别? +- Source file: raw/AI/LLMs、RAG、AI Agent 三个到底什么区别?.md +- Status: ✅ 成功摄入 +- Summary: LLM(大语言模型/"天才大脑")、RAG(检索增强生成/"随身图书馆助理")、AI Agent(人工智能代理/行动系统)三者区别与组合架构——用于思考的 LLM、用于认知的 RAG、用于执行的 Agent +- Concepts created: LLM(新增), RAG(更新), AI代理(更新) +- Entities created: ChatGPT(新增), DeepSeek(新增), Qwen(新增), Midjourney(新增), Stable Diffusion(新增) +- Source page: wiki/sources/LLMs-RAG-AI-Agent-san-ge-dao-di-shen-me-qu-bie.md +- Notes: + ## [2026-04-18] ingest | 文字生成视频网站推荐 - Source file: raw/AI/文字生成视频网站推荐.md - Status: ✅ 成功摄入 diff --git a/wiki/overview.md b/wiki/overview.md index 66d852b8..23a9197c 100644 --- a/wiki/overview.md +++ b/wiki/overview.md @@ -6,6 +6,10 @@ AI 开源项目、Cloud & DevOps、Vibe Coding、AI时代个人发展 ## 核心概念 - Print Mode:Hermes 通过 stdin 调用 Claude Code 的非交互执行模式 - TMUX 交互模式:在 TMUX 会话中运行 Claude Code 的交互模式,适合超长任务 +- DeepSeek:中国 AI 公司开发的大语言模型,以开源和高效著称,DeepSeek-R1 在复杂任务处理方面表现出色 +- 提示语设计:通过精心设计的提示词提升 AI 输出质量的技术 +- Nano Banana Pro:Google 的专业级图像生成模型,具备物理规则推演、构图美学理解、语义上下文推理能力 +- AI幻觉:AI 生成看似合理但实际错误的内容,需通过技巧避免 - Wayland:Linux 桌面环境的现代显示协议,Ubuntu 24.04 默认使用,出于安全限制外部程序在未登录状态下获取屏幕控制权 - X11 (Xorg):传统 Linux 显示协议,兼容性更好,支持远程桌面软件,是 Wayland 的替代方案 - GDM3:GNOME Display Manager,Ubuntu 的登录管理器,支持 Wayland 和 X11 两种显示协议 diff --git a/wiki/sources/LLMs-RAG-AI-Agent-san-ge-dao-di-shen-me-qu-bie.md b/wiki/sources/LLMs-RAG-AI-Agent-san-ge-dao-di-shen-me-qu-bie.md new file mode 100644 index 00000000..3a8e7995 --- /dev/null +++ b/wiki/sources/LLMs-RAG-AI-Agent-san-ge-dao-di-shen-me-qu-bie.md @@ -0,0 +1,53 @@ +--- +title: "LLMs、RAG、AI Agent 三个到底什么区别?" +type: source +tags: [llm, rag, ai-agent] +date: 2025-11-19 +--- + +## Source File +- [[raw/AI/LLMs、RAG、AI Agent 三个到底什么区别?.md]] + +## Summary +- 核心主题:LLM(大型语言模型)、RAG(检索增强生成)、AI Agent(人工智能代理)三者区别 +- 问题域:AI 应用开发基础概念区分 +- 方法/机制: + - LLM = "天才大脑",擅长思考但对当前情况无知 + - RAG = "随身图书馆助理",为 LLM 提供实时外部知识 + - AI Agent = 行动系统,感知→规划→执行→反思的循环 +- 结论/价值:三者不是竞争技术,而是在不同层面满足不同场景的能力组合,未来架构应将三者结合 + +## Key Claims +- LLM 只能回答训练数据截止时间之前的问题,对实时信息一无所知 +- RAG 通过检索外部知识库为 LLM 提供实时信息,极大降低幻觉 +- AI Agent 通过五步循环(获取任务→扫描场景→思考→行动→迭代)实现自主决策和执行 +- 最佳实践:LLM 负责推理,RAG 确保准确性,Agent 实现自主性 + +## Key Quotes +> "LLM 在思考方面非常出色,但对当前情况却一无所知。" — 作者观点 +> "RAG 就像是给那个'全能天才大脑'配备了一位随身图书馆助理。" — 作者类比 +> "AI Agent 围绕大脑 LLM 构建一个循环控制系统,能够感知目标、规划步骤、执行动作、并能够反思结果。" — 作者定义 +> "未来不在于选择其一。而在于将三者结合起来进行架构设计。用于思考的 LLMs,用于认知的 RAG,用于执行的 Agent。" — 核心结论 + +## Key Concepts +- [[LLM]]:大型语言模型,AI 应用的"天才大脑" +- [[RAG]]:检索增强生成,为 LLM 提供外部实时知识的机制 +- [[AI代理]]:具备自主决策和任务执行能力的 AI 系统 +- [[向量数据库]]:RAG 系统中存储和检索知识的技术 +- [[NL2SQL]]:自然语言转 SQL,使 Agent 能查询数据库 + +## Key Entities +- [[ChatGPT]]:OpenAI 开发的底座大模型 +- [[DeepSeek]]:中国开发的大语言模型 +- [[Qwen]]:阿里云开发的大语言模型 +- [[Midjourney]]:专用于图像生成的 AI 模型 +- [[Stable Diffusion]]:开源图像生成模型 + +## Connections +- [[LLM]] ← depends_on ← [[RAG]] +- [[RAG]] ← provides_context ← [[向量数据库]] +- [[AI代理]] ← uses ← [[LLM]] +- [[AI代理]] ← uses ← [[RAG]] + +## Contradictions +- (暂无冲突记录) \ No newline at end of file diff --git a/wiki/sources/Nano-Banana-提示词框架.md b/wiki/sources/Nano-Banana-提示词框架.md new file mode 100644 index 00000000..ec320a62 --- /dev/null +++ b/wiki/sources/Nano-Banana-提示词框架.md @@ -0,0 +1,40 @@ +--- +title: "Nano Banana 提示词框架" +type: source +tags: [ai, google, nano-banana, prompt] +date: 2026-04-18 +--- + +## Source File +- [[raw/AI/Nano Banana 提示词框架.md]] + +## Summary +- 核心主题:Google Nano Banana 图像生成模型的提示词框架 +- 问题域:AI 图像生成提示词设计 +- 方法/机制:结构化 JSON 提示词模板,分物件描述和人物描述两类框架 +- 结论/价值:提供标准化的提示词结构,提高图像生成质量和一致性 + +## Key Claims +- 物件描述框架包含 9 个核心维度:shot、subject、environment、lighting、camera、color_grade、style、quality、negatives +- 人物描述框架包含年龄、外貌、姿态等人物特有属性 +-camera 配置包含焦距、光圈、角度三个参数 + +## Key Quotes +> "shot": "", +> "subject": { "item": "", "materials": "", "details": "", "condition": "" }, +> "lighting": "", + +## Key Concepts +- [[物件描述框架]]:包含 item、materials、details、condition 四个子属性的结构化描述模板 +- [[人物描述框架]]:包含 age、appearance、pose 三个特定属性的结构化描述模板 +- [[Camera Config]]:focal_length、aperture、angle 三个相机参数配置 + +## Key Entities +- [[Google]]:发布 Nano Banana 图像生成模型的公司 +- [[Nano Banana]]:Google 的专业级图像生成模型 + +## Connections +- [[Nano-Banana-Pro-Prompt-Guide]] ← extends ← [[Nano-Banana-提示词框架]] + +## Contradictions +- (暂无) \ No newline at end of file diff --git a/wiki/sources/OpenAI-ChatGPT-个性化定义.md b/wiki/sources/OpenAI-ChatGPT-个性化定义.md new file mode 100644 index 00000000..c5694e2d --- /dev/null +++ b/wiki/sources/OpenAI-ChatGPT-个性化定义.md @@ -0,0 +1,43 @@ +--- +id: openai-chatgpt-个性化定义 +title: "OpenAI ChatGPT 个性化定义" +type: source +tags: [ai, chatgpt, customization, openai] +date: 2026-04-18 +--- + +## Source File +- [[raw/AI/OpenAI ChatGPT 个性化定义.md]] + +## Summary +- 核心主题:ChatGPT 个性化配置与自定义指令设置 +- 问题域:AI 个性化助手配置 +- 方法/机制:通过自定义指令和行为偏好设置,实现符合用户需求的 AI 交互体验 +- 结论/价值:用户背景(47岁自由职业者,前云服务交付高级经理,转型TikTok跨境电商)决定了对 AI 的高标准要求——专业、准确、有深度 + +## Key Claims +- 用户要求 AI 尽可能提出出乎意料的解决方案,而非按常规路径思考 +- 用户视自己为所有领域的专家,希望 AI 以平等专家身份对话,而非启蒙式交互 +- 用户重视论证质量而非来源权威性,来源本身无关紧要 +- 用户要求 AI 在使用高度推测性内容时明确告知,而非当作确定事实呈现 +- 用户明确拒绝道德说教,仅在关键且非显而易见时讨论安全问题 + +## Key Quotes +> "错误会削弱我的信任,所以务必做到准确和详尽" — 用户对准确性的高标准要求 +> "重视合理的论据,而非权威,来源无关紧要" — 用户对知识来源的务实态度 + +## Key Concepts +- [[自定义指令]]:用户为 ChatGPT 设置的行为指导原则 +- [[个性化配置]]:根据用户背景和需求定制的 AI 交互方式 + +## Key Entities +- [[OpenAI]]:ChatGPT 的开发商 +- [[ChatGPT]]:OpenAI 开发的大型语言模型 + +## Connections +- [[OpenAI]] ← provides ← [[ChatGPT]] +- [[ChatGPT]] ← supports ← [[自定义指令]] +- [[个性化配置]] ← applies_to ← [[ChatGPT]] + +## Contradictions +- (暂无) \ No newline at end of file diff --git a/wiki/sources/google-nano-banana-pro-prompt-guide.md b/wiki/sources/google-nano-banana-pro-prompt-guide.md new file mode 100644 index 00000000..9e2fd951 --- /dev/null +++ b/wiki/sources/google-nano-banana-pro-prompt-guide.md @@ -0,0 +1,47 @@ +--- +title: "谷歌Nano Banana Pro提示词指南" +type: source +tags: [] +date: 2025-12-18 +--- + +## Source File +- [[raw/AI/谷歌深夜甩出一份【Nano Banana Pro提示词指南】,手把手教你生产专业级内容,实战案例+提示词模版.md]] + +## Summary +- 核心主题:Google 发布的 Nano Banana Pro 图像生成模型的专业级提示词设计指南 +- 问题域:AI 图像生成的专业化应用 +- 方法/机制:10个专业内容生产技巧,包括提示词黄金法则、文本渲染、角色一致性、信息锚定、高级编辑、维度转换、高分辨率、思考推理、故事板生成、结构控制 +- 结论/价值:将 AI 图像生成从"趣味性"转向"功能性"专业资产生产,实现 4K 级专业输出 + +## Key Claims +- Nano Banana Pro 是具备物理规则推演、构图美学理解、语义上下文推理能力的"会思考"模型 +- 最佳实践是"编辑而非重新生成",保留 80% 正确的基础上进行修改 +- 支持最多 14 张参考图像(6 张高保真度),实现身份锁定 +- 利用 Google 搜索实现实时信息锚定,减少 AI 幻觉 + +## Key Quotes +> "要获得最佳效果,请停止使用'标签堆砌',开始像创意总监一样思考。" — 谷歌官方指南 + +## Key Concepts +- [[提示词黄金法则]]:编辑而非重新生成、使用自然语言和完整句子、具体且具有描述性、提供上下文 +- [[文本渲染]]:Nano Banana Pro 最先进的能力,可渲染清晰易读、风格化的文本 +- [[角色一致性]]:通过身份锁定技术保持角色面部特征一致 +- [[信息锚定]]:利用 Google 搜索基于实时数据生成图像 +- [[图像修补]]:通过语义指令进行复杂编辑,无需手动绘制遮罩 +- [[维度转换]]:2D 示意图与 3D 可视化之间的转换 +- [[4K分辨率]]:支持原生 1K 至 4K 图像生成 +- [[思考模式]]:在渲染前生成临时思考图像优化构图 + +## Key Entities +- [[Google]]:发布 Nano Banana Pro 的 Google 生成式 AI 团队 +- [[Nano Banana Pro]]:Google 的专业级图像生成模型(可能指 Imagen 3) + +## Connections +- [[Google]] ← publishes ← [[Nano Banana Pro]] +- [[Nano Banana Pro]] ← implements ← [[提示词黄金法则]] +- [[Nano Banana Pro]] ← supports ← [[角色一致性]] +- [[Nano Banana Pro]] ← utilizes ← [[信息锚定]] + +## Contradictions +- (暂无发现冲突) \ No newline at end of file diff --git a/wiki/sources/清华出的DeepSeek使用手册104页真的是太厉害了免费领取.md b/wiki/sources/清华出的DeepSeek使用手册104页真的是太厉害了免费领取.md new file mode 100644 index 00000000..8328ba05 --- /dev/null +++ b/wiki/sources/清华出的DeepSeek使用手册104页真的是太厉害了免费领取.md @@ -0,0 +1,46 @@ +--- +title: "清华出的DeepSeek使用手册,104页,真的是太厉害了!(免费领取)" +type: source +tags: [DeepSeek, AI, 教程, 提示工程] +date: 2025-12-18 +--- + +## Source File +- [[raw/AI/清华出的DeepSeek使用手册,104页,真的是太厉害了!(免费领取).md]] + +## Summary +- 核心主题:DeepSeek 大语言模型的使用教程与提示语设计指南 +- 问题域:AI 工具使用、提示工程最佳实践 +- 方法/机制:原理讲解 + 实战技巧 + 避免 AI 幻觉策略 +- 结论/价值:清华大学官方教程,104页干货,帮助用户从入门到精通 DeepSeek + +## Key Claims +- DeepSeek 是中国专注于通用人工智能(AGI)的科技公司 +- DeepSeek-R1 开源推理模型在复杂任务处理方面表现出色 +- 清华手册"授人以渔",讲解提示词底层逻辑而非仅提供模板 +- 文档涵盖避免 AI 幻觉的小窍门和设计超棒提示语的秘籍 + +## Key Quotes +> "这才是真正的'授人以渔',太有用了" — 作者评价清华手册 +> "帮助用户更好地理解和应用 DeepSeek 技术,展现了中国在人工智能领域的强大实力和创新能力" + +## Key Concepts +- [[DeepSeek]]:中国 AI 公司开发的大语言模型 +- [[DeepSeek-R1]]:开源推理模型,擅长处理复杂任务 +- [[提示语设计]]:通过精心设计的提示词提升 AI 输出质量的技术 +- [[AI幻觉]]:AI 生成看似合理但实际错误的内容,需通过技巧避免 + +## Key Entities +- [[清华大学]]:中国顶尖大学,其新闻与传播学院发布了此教程 +- [余梦珑]:清华大学博士后,该手册作者 +- [[DeepSeek]]:专注于 AGI 的中国科技公司 +- [顶级程序员]:发布该文章的微信公众号 + +## Connections +- [[DeepSeek]] ← authored_by ← [余梦珑] +- [清华大学] ← published ← [[DeepSeek使用手册]] +- [[DeepSeek-R1]] ← is_variant ← [[DeepSeek]] +- [[提示语设计]] ← applies_to ← [[DeepSeek]] + +## Contradictions +- (暂无) \ No newline at end of file diff --git a/wiki/sources/详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决.md b/wiki/sources/详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决.md new file mode 100644 index 00000000..01a499c3 --- /dev/null +++ b/wiki/sources/详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决.md @@ -0,0 +1,51 @@ +--- +title: "详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决" +type: source +tags: [] +date: 2025-04-18 +--- + +## Source File +- [[raw/AI/详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决 1.md]] + +## Summary +- 核心主题:本地离线部署大语言模型运行环境,实现免费私密的 LLM 使用体验 +- 问题域:大模型本地部署、网络环境受限场景下的离线安装 +- 方法/机制:Ollama 安装、Docker 部署、模型离线下载、API 配置、WebUI 集成 +- 结论/价值:通过 Ollama + DeepSeek + Open-WebUI 组合,可在本地搭建完整的私有 AI 对话基础设施 + +## Key Claims +- Ollama 是开源的本地大语言模型运行框架,可便捷在本地部署和运行大型语言模型 +- 通过 Docker 部署 Ollama 可实现便捷的安装、更新与启停管理 +- DeepSeek-R1 模型提供从 1.5B 到 671B 多种参数规模,可根据硬件配置选择 +- Open-WebUI 提供基于浏览器的图形化界面,方便与本地 LLM 交互 +- 国内网络环境可通过网盘、魔塔社区、HF 镜像站等渠道解决模型下载问题 + +## Key Quotes +> "你应该至少有 4 GB 的 RAM 来运行 1.5B 模型,至少有 8 GB 的 RAM 来运行 7B 模型,16 GB 的 RAM 来运行 13B 模型,以及 32 GB 的 RAM 来运行 33B 模型。" — 硬件配置建议 + +> "假若需要本地私有化部署具有实用性的模型,应至少有独立显卡并有 4G 以上显存。纯 CPU 模式虽然也可以运行,但生成速度很慢,仅适用于本地开发调试体验一下。" — GPU 推荐 + +> "如果是在云服务器等拥有公网IP的环境上部署,请谨慎做此设置,否则可能导致 API 服务被恶意调用。" — 安全警告 + +## Key Concepts +- [[Ollama]]:本地大语言模型运行环境框架 +- [[DeepSeek]]:中国开发的大语言模型,以开源和高效著称 +- [[Open-WebUI]]:开源的大语言模型 Web UI 界面 +- [[Docker]]:容器化部署技术 +- [[RAG]]:检索增强生成,本地知识库构建技术 +- [[向量嵌入]]:RAG 使用的文本向量化技术 +- [[bge-m3]]:中文嵌入模型,用于 RAG 知识库构建 + +## Key Entities +- [[DeepSeek]]:模型提供商,提供 DeepSeek-R1 系列模型 +- [[Ollama]]:开源 LLM 运行框架 +- [[Open WebUI]]:开源 Web 界面项目 + +## Connections +- [[Ollama]] ← runs ← [[DeepSeek-R1]] +- [[Open-WebUI]] ← connects_to ← [[Ollama]] +- [[Ollama]] ← hosts ← [[API Service]] + +## Contradictions +- (暂无) \ No newline at end of file