feat(wiki): deep ingest batch 3 (19 source pages, AI dir focus)

This commit is contained in:
2026-04-14 21:56:47 +08:00
parent 483d6fcae2
commit aec1052b8e
7 changed files with 291 additions and 51 deletions

View File

@@ -0,0 +1,59 @@
---
title: "2025 年 11 个神级 AI 开源平替"
type: source
tags: ['AI', '开源', 'DeepSeek', 'Qwen', 'Flux', 'HunyuanVideo', 'OpenManus', 'Cline', 'GitHub']
date: 2026-01-01
source: https://mp.weixin.qq.com/s/
author: 逛逛
---
## Source File
- [[raw/AI/2025 年 11 个神级 AI 开源平替GitHub 杀疯了。.md]]
## Summary
- 核心主题2025 年 GitHub 最火的 11 个 AI 开源平替项目,横跨 LLM/AI生图/AI生视频/AI Agent/AI编程 五大方向
- 问题域:闭源 AI 产品主导市场,但开源社区持续推出性能逼近甚至部分超越闭源的替代方案
- 方法/机制:按应用方向分类,每个方向推荐 1-3 个最优开源项目及核心优势
- 结论/价值国产开源模型DeepSeek R1、Qwen 3、HunyuanVideo在多个维度已超越国际竞争者Manus 以数十亿美元被 Meta 收购标志着 AI Agent 元年正式开启
## Key Claims
### 大语言模型
- **DeepSeek R1**2025 年春节破壁者,开源首个 o1 级深度推理模型,价格战主力
- **Qwen 3**:开源界六边形战士,全尺寸覆盖,极致工具调用能力,最稳最全基座模型
- **国产其他**:智谱 GLM、Kimi K2、MiniMax
### AI 生图
- **Flux**(前 SD 核心团队):开源 Midjourney人体解剖学最正确开源模型精准文字渲染海报/Logo 能力)
- **Stable Diffusion 3.5**LoRA+ControlNet 生态最丰富,动漫角色、精确姿势控制首选,中端显卡友好
### AI 生视频
- **HunyuanVideo**(腾讯):开源参数量最大视频生成模型之一,中文 Prompt 理解天花板,动作连贯符合物理直觉,高分辨率原生支持
### 通用智能体
- **Manus**2025 年现象级产品,定义 AI Agent 元年,被 Meta 数十亿美元收购
- **OpenManus**Manus 开源平替5万+ Stars规划→执行→循环反馈自己打开浏览器搜索、读取网页、写 Python 代码
### AI 编程
- **Cline**Cursor 开源平替VS Code 最强开源自主编程插件MCP 扩展连接本地数据库,敏感操作需用户授权(安全+自主平衡)
## Key Quotes
> "DeepSeek R1 是开源界首个将 o1 级深度推理拉下神坛的破壁者。"
> "Qwen 3 是最稳、最全、最能打的基座模型,流水的开源模型,铁打的通义千问。"
## Key Entities
- [[DeepSeek R1]]:国产深度推理开源大模型
- [[Qwen 3]]:阿里通义千问,开源六边形战士
- [[Manus]]AI Agent 元年里程碑产品,被 Meta 收购
- [[OpenManus]]Manus 开源实现,规划-执行-循环反馈
- [[HunyuanVideo]]:腾讯混元视频,开源视频生成
- [[Flux]]:开源图像生成,文字渲染能力最强
- [[Cline]]VS Code 开源 AI 编程插件
## Connections
- [[DeepSeek R1]] ← competes_with ← [[OpenAI o1]]
- [[Qwen 3]] ← is_open_source_alternative_to ← [[GPT-4]]
- [[OpenManus]] ← is_open_source_of ← [[Manus]]
- [[Cline]] ← is_open_source_alternative_to ← [[Cursor]]
## Contradictions
- (无已知冲突)

View File

@@ -1,37 +1,49 @@
---
title: "LLMs、RAG、AI Agent三个到底什么区别"
title: "LLM、RAG、AI Agent 三者区别详解"
type: source
tags: [llm, rag, ai-agent]
tags: ['LLM', 'RAG', 'AI Agent', 'AI', '入门', '概念区分']
date: 2025-11-19
source: https://mp.weixin.qq.com/s/
author: AI工程化
---
## Source File
- [[raw/AI/LLMs、RAG、AI Agent 三个到底什么区别?.md]]
## Summary
- 核心主题LLM、RAG、AI Agent三者区别
- 问题域AI应用开发初学者容易混淆这三个概念
- 方法/机制:分层定位LLM思考、RAG认知、Agent执行
- 结论/价值:三者不是竞争技术,而是在不同层面满足不同场景的能力展示
- 核心主题:用通俗比喻解释 LLM、RAG、AI Agent 三个核心 AI 应用概念的区别与关系
- 问题域:初入 AI 应用开发者被这三个术语混淆,不理解它们是互补关系而非竞争关系
- 方法/机制:比喻法——LLM 是"天才大脑"、RAG 是"随身图书馆助理"、AI Agent 是"能走能想能查的完整行动系统"
- 结论/价值:三者不是竞争技术,而是在三个不同层面满足不同场景的能力展示;未来架构=LLM(推理)+RAG(准确性)+Agent(自主性)
## Key Claims
- LLM是"天才大脑",擅长思考但对当前情况一无所知
- RAG是"随身图书馆助理",提供实时信息消除幻觉
- AI Agent是智能体围绕LLM构建循环控制系统能感知、规划、执行、反思
- 未来架构设计在于将三者结合LLM推理、RAG准确性、Agent自主性
- **LLM天才大脑**:学习了过去所有知识,能回答问题,但知识有截止日期,不知当前信息
- 底座模型ChatGPT、DeepSeek、Qwen通用
- 专有模型Midjourney绘画、Claude编程专项训练
- **RAG检索增强生成= 随身图书馆助理**:将静态 LLM 链接到外部实时知识库,解决知识时效性问题
- 流程:用户提问 → 检索外部知识库 → 将相关 chunk+原始问题输入 LLM → 基于上下文生成答案
- 优势:知识更新无需重新训练、消歧义、引用来源
- **AI Agent智能体**:有脑+有信息+有行动能力,构建"感知→规划→执行→反思"循环控制系统
- 五步循环:获取任务→扫描场景→仔细思考→采取行动→观察迭代
- RAG 提供给 Agent "借书证",使其立足于事实而非幻觉
- 三者关系LLM=思考RAG=认知准确信息Agent=执行,三者叠加构成完整生产系统
## Key Quotes
> "LLM 在思考方面非常出色,但对当前情况却一无所知。"
> "RAG 就像是给那个'全能天才大脑'配备了一位随身图书馆助理。"
> "用 LLM 进行推理,用 RAG 确保准确性,用 Agent 框架实现自主性。"
## Key Concepts
- [[LLM]]大语言模型AI应用的"天才大脑"
- [[RAG]]检索增强生成AI的"随身图书馆助理"
- [[AI Agent]]:智能体,具备感知-规划-执行-反思的循环控制
- [[幻觉]]LLM生成错误信息的问题
## Key Entities
- [[LLM]]大语言模型AI 应用的"天才大脑",负责推理和生成
- [[RAG]]检索增强生成):解决 LLM 知识时效性问题,为模型提供外部实时知识查询能力
- [[AI Agent]]:智能体,感知-规划-执行-反思的闭环自主系统
- [[Agent五步循环]]:获取任务→扫描场景→仔细思考→采取行动→观察迭代
- [[三层AI架构]]LLM(思考层)+RAG(知识层)+Agent(行动层),三者缺一不可
## Connections
- [[LLM]] ← provides ← [[思考能力]]
- [[RAG]] ← extends ← [[LLM]]
- [[AI Agent]] ← uses ← [[LLM]]
- [[AI Agent]] ← uses ← [[RAG]]
- [[AI Agent]] ← uses ← [[RAG]]Agent 通过 RAG 获取实时信息)
- [[AI Agent]] ← uses ← [[LLM]]Agent 的核心推理引擎)
- [[RAG]] ← augments ← [[LLM]]RAG 扩展 LLM 的知识边界)
## Contradictions
- 常见误解:认为三者择一使用。实际上生产级系统三者叠加,缺一不可

View File

@@ -1,35 +1,37 @@
---
title: "Nano Banana提示词框架"
title: "Nano Banana 提示词框架:物件与人物结构化描述模板"
type: source
tags: [nano-banana, prompt-engineering, image-generation]
date: 2025-03-15
tags: ['NanoBanana', 'Prompt', '图像生成', 'Google', 'AI', '提示词框架']
date: 2025-10-01
source:
author: shenwei
---
## Source File
- [[raw/AI/Nano Banana 提示词框架.md]]
## Summary
- 核心主题Nano Banana图像生成提示词框架
- 问题域:如何结构化描述图像生成需求
- 方法/机制:物件描述框架和人物描述框架的JSON结构
- 结论/价值:通过标准化框架精确控制AI生成图像
- 核心主题Nano Banana 图像生成模型的系统化 Prompt 框架,提供物件和人物两类结构化描述模板
- 问题域:用户不知道如何结构化描述画面元素,导致生成结果不稳定或不精确
- 方法/机制:将图像描述分解为 shot/subject/environment/lighting/camera/color_grade/style/quality/negatives 等字段,填入 JSON 模板
- 结论/价值:结构化 Prompt 是 Nano Banana 生成高质量图像的关键,比自由文本描述准确率高得多
## Key Claims
- 物件描述框架shotsubjectitem/materials/details/condition)、environmentlightingcameracolor_gradestylequalitynegatives
- 人物描述框架subjectage/appearance/pose等字段
- Nano Banana是Google的图像生成模型
- **物件描述框架**shot + subject(item/materials/details/condition) + environment + lighting + camera(focal_length/aperture/angle) + color_grade + style + quality + negatives
- **人物描述框架**shot + subject(age/gender/race/build/clothing/hair/facial expression) + environment + lighting + camera + style
- **核心字段**shot景别、negatives负向提示词用于排除不需要的元素、camera镜头参数
- Nano Banana 的差异化优势文本渲染精准文字植入图像、4K 分辨率、角色一致性
## Key Concepts
- [[提示词框架]]:结构化描述图像生成需求的模板
- [[Nano Banana]]Google AI图像生成模型
- [[物件描述]]:商品/物品的标准化描述结构
- [[人物描述]]:人物的标准化描述结构
- [[NanoBanana]]Google 专业级 AI 图像生成模型
- [[结构化Prompt框架]]:将图像描述分解为标准字段,减少生成不确定性
- [[负向提示词]]Negatives明确告诉模型不要出现什么提升画面纯净度
## Key Entities
- [[Nano Banana]]Google AI图像生成模型
- [[Google]]Nano Banana 开发商
## Connections
- [[AI图像生成]] ← uses ← [[提示词框架]]
- [[Nano Banana]] ← supports ← [[提示词框架]]
- [[NanoBanana]] ← uses ← [[结构化Prompt框架]]
## Contradictions
- (无已知冲突)

View File

@@ -0,0 +1,42 @@
---
title: "RAG 从入门到精通系列1基础 RAG 完全指南"
type: source
tags: ['RAG', 'LLM', '检索增强生成', 'Embedding', '向量数据库', 'LangChain', '教程']
date: 2025-01-16
source: https://mp.weixin.qq.com/s/
author: 南七无名式
---
## Source File
- [[raw/AI/RAG从入门到精通系列1基础RAG.md]]
## Summary
- 核心主题RAG检索增强生成基础概念与三步流程Indexing→Retrieval→Generation详解
- 问题域LLM 知识有截止日期且无法直接访问私有/最新数据RAG 解决此信息缺失问题
- 方法/机制:外部文档→切分(Split)→向量化(Embedding)→存储向量数据库→用户提问→检索相关Chunk→输入LLM生成答案
- 结论/价值RAG 是 LLM 连接私有知识的标准方案,基础 RAG 三步流程是所有高级 RAG 技巧的基础
## Key Claims
- **RAG 三步流程**
1. **Indexing索引**:加载外部文档 → 切分为 chunks → 向量化 → 存入向量数据库
2. **Retrieval检索**:用户问题向量化 → 从向量库检索 top-k 相关 chunks
3. **Generation生成**:将问题+检索结果作为上下文输入 LLM → 生成最终答案
- **Embedding向量化**:将文本转为捕获语义的固定长度向量;余弦相似度计算相关性
- **Chunking切分**Embedding 模型 context window 有限512-8192 tokens需将文档切分为满足窗口的 chunks
- **LangChain**RAG 主流开发框架160+ 文档加载器,支持多种向量数据库
- Embedding 模型选择开源BAAI 系列)为主流方案
## Key Concepts
- [[RAG]](检索增强生成):解决 LLM 知识时效性和私有数据访问问题的标准方案
- [[Indexing]]RAG 第一步文档→chunk→vector→vectorDB
- [[Embedding]]:文本→语义向量的转换过程,是 RAG 检索的核心
- [[Chunking]]:将长文档切分为适合 embedding 模型 context window 的小块
- [[向量数据库]]:存储 embedding vectors 的数据库,支持余弦相似度检索
## Connections
- [[RAG]] ← is_composed_of ← [[Indexing]] + [[Retrieval]] + [[Generation]]
- [[Embedding]] ← is_step_in ← [[Indexing]]
- [[Chunking]] ← is_step_in ← [[Indexing]]
## Contradictions
- (无已知冲突)

View File

@@ -0,0 +1,52 @@
---
title: "大模型术语全总结LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏"
type: source
tags: ['LLM', 'MCP', 'RAG', 'vLLM', 'Token', '数据蒸馏', '术语', 'AI']
date: 2025-12-20
source: https://mp.weixin.qq.com/s/
author: AI工程化
---
## Source File
- [[raw/AI/大模型相关术语和框架总结LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏.md]]
## Summary
- 核心主题系统梳理大模型核心术语LLM、MCP、RAG、Agent、LangChain、vLLM、Token、数据蒸馏的含义与关系
- 问题域AI 术语快速迭代,开发者难以系统理解核心概念及其关联
- 方法/机制:每个术语配合图示和生活化比喻,解释技术本质和协作关系
- 结论/价值:形成完整 LLM 技术栈认知地图LLM推理+MCP工具连接+RAG知识补充+vLLM高效推理
## Key Claims
- **LLM**≥1B 参数的语言模型GPT-2=1.5B、GPT-3=175B分底座通用和专有专项两类
- **Prompt**:输入 LLM 的提示词,是与大模型交互的唯一接口
- **MCP模型上下文协议**LLM 连接外部数据源/工具的标准化协议;大模型只告诉你"该调用什么工具",实际调用需通过 MCP Client→Server 执行
- **Agent = LLM + MCP**LLM 输出步骤Agent 执行动作LLM 给你"发邮件的方法"Agent 真正发出邮件
- **RAG检索增强生成**:解决 LLM 幻觉问题;检索外部知识库→将 chunk+问题输入 LLM→基于上下文生成比做给"天才大脑"配"图书馆助理"
- **Embedding向量化**:词→浮点数向量→计算语义距离;"一百"到"两百"比到"一千"更近
- **LangChain**:快速构建 Agent 的开发框架,标准接口连接 LLM、工具、数据源
- **vLLM**:高效 GPU 推理引擎核心PagedAttentionKV Cache 分块管理)+ 连续批处理(减少 GPU 空载)
- **Token**基本输入单元1英文字符≈0.3 Token1中文字符≈0.6 Token
- **数据蒸馏Data Distillation**:用大模型生成精简高质量训练数据,蒸馏到小模型使其逼近大模型效果
## Key Quotes
> "大模型是不会自己去调用外部数据源或者工具的,大模型只会告诉我们需要调用哪些工具,而我们需要自己去实现工具的调用。"
> "LLM 复习局限于特定的数据集,面对陌生领域会'写一个解字然后放飞自我'RAG 给了提示,让正确率从 60% 到 90%。"
## Key Concepts
- [[MCP]]模型上下文协议LLM 连接外部工具/数据的标准化通信协议Anthropic/Claude Code/ Cursor 均支持
- [[Agent执行模型]]LLM给步骤 + MCP执行工具 = Agent真正完成任务
- [[PagedAttention]]vLLM 的 KV Cache 分块管理技术,避免连续内存碎片化和 OOM
- [[连续批处理]]Continuous BatchingvLLM 推理优化,步进级调度 GPU 任务,减少空闲
## Key Entities
- [[LangChain]]Agent 开发框架
- [[vLLM]]:高效 LLM 推理开源项目
## Connections
- [[Agent]] ← is_combined_from ← [[LLM]] + [[MCP]]
- [[RAG]] ← augments ← [[LLM]]
- [[vLLM]] ← enables ← [[LLM]](高效推理)
- [[数据蒸馏]] ← trains ← [[LLM]]
## Contradictions
- (无已知冲突)

View File

@@ -0,0 +1,37 @@
---
title: "如何写出完美的 Prompt从职场指令失误案例看提示词工程"
type: source
tags: ['Prompt', '提示词', 'AI', '职场沟通', '指令设计']
date: 2025-12-02
source: https://mp.weixin.qq.com/s/
author: 粒粒121
---
## Source File
- [[raw/AI/如何写出完美的Prompt提示词.md]]
## Summary
- 核心主题:通过三个职场指令失误场景(模糊指令导致下属无从下手),揭示 Prompt 工程的核心原则——信息完整性和上下文清晰度
- 问题域AI 用户给 AI 的指令往往和老板给下属的指令一样模糊,导致 AI 输出质量差、用户失望
- 方法/机制:以职场场景类比,演示"差 Prompt"缺少关键上下文vs"好 Prompt"(明确范围、目标、约束、验收标准)
- 结论/价值:给 AI 写 Prompt = 给下属布置任务;缺乏关键信息的 Prompt = "你看着办"AI 只能猜测,用户得到"草稿"而非"成果"
## Key Claims
- 差指令的三个典型场景:
1. "把这份表格填写下,尽快!"(缺少背景、目的、对接人、截止时间)
2. "调研一下出海方案"(范围太宽,缺乏地区/产品/时间约束)
3. "给我一份推广方案,你看着办!"(缺少目标客户、预算、偏好限制)
- 好 Prompt 的要素Who角色、What具体任务、When截止、Where范围、Why目的、How验收标准
- AI Prompt 与职场指令的类比:模糊指令 → 下属/AI 只能猜测 → 输出质量差 → 反复返工
## Key Concepts
- [[Prompt完整性]]:好 Prompt 需包含足够的上下文(背景、目的、约束),而非简单一句话
- [[职场指令类比]]:给 AI 写 Prompt 等同于给下属布置任务,缺少关键信息的结果相同——猜测+低质量输出
- [[提示词工程]]:系统研究如何设计有效 Prompt 的学科,核心是减少歧义、增加约束
## Connections
- [[Prompt完整性]] ← is_principle_of ← [[提示词工程]]
- [[提示词工程]] ← applies_to ← [[AI]]
## Contradictions
- (无已知冲突)

View File

@@ -1,28 +1,64 @@
---
title: "系统提示词构建原则"
title: "系统提示词构建原则AI 编码助手行为准则)"
type: source
tags: []
date: 2025-03-14
tags: ['系统提示词', 'Prompt', 'AI', '编码助手', 'VibeCoding', 'GitHub']
date: 2025-12-30
source: https://github.com/2025Emma/vibe-coding-cn
author: vibe-coding-cn 社区
---
## Source File
- [[raw/AI/系统提示词构建原则.md]]
## Summary
- 核心主题:系统提示词System Prompt的构建原则与最佳实践
- 问题域:Prompt工程、系统提示词设计
- 方法/机制:结构化设计系统提示词的各组成部分
- 结论/价值:高质量系统提示词是AI应用稳定输出的基础
- 核心主题:AI 编码助手的系统提示词构建原则,涵盖身份行为准则、沟通互动、任务执行、技术编码、安全防护、工具使用六大维度
- 问题域:如何构建一个"懂规矩、会干活、不乱来"的 AI 编码助手系统提示词
- 方法/机制:从 GitHub 项目 vibe-coding-cn 提炼的 95 条原则,分六大类,可直接作为 Claude Code/GitHub Copilot 等工具的 System Prompt 模板
- 结论/价值:这是目前最完整的 AI 编码助手行为准则清单之一,每条原则都有具体执行细节
## Key Claims
- 系统提示词应包含:角色定义、任务范围、输出格式、约束条件
- 好的系统提示词需要清晰、无歧义、可执行
- 需要持续迭代优化,根据实际输出效果调整
### 核心身份与行为准则15条
- 严格遵守项目现有约定,优先分析周围代码而非假设
- 彻底完成用户请求,包括合理的隐含后续操作
- 未经用户确认,不执行超出明确范围的重大操作
- 专注解决问题,而非过程
### 沟通与互动18条
- 专业、直接、简洁的语气;避免对话式填充语
- 在执行工具前,简要告知用户你将做什么
- 减少输出冗余,避免不必要的总结
- 澄清问题时主动提问,而非猜测用户意图
### 任务执行与工作流24条
- 复杂任务必须使用 TODO 列表规划
- 遵循"理解→计划→执行→验证"的开发循环
- 优先探索Read-only scan而非立即行动
- 尽可能并行化独立的信息收集操作
### 技术与编码规范29条
- 优化代码清晰度和可读性;变量名应为名词,函数名应为动词
- 优先使用完整单词而非缩写
- 使用卫语句/提前返回,避免深层嵌套
- 移动优先的 UI 设计原则
### 安全与防护10条
- 执行修改文件系统的命令前,必须解释目的和潜在影响
- 绝不引入或提交暴露密钥/API 密钥的代码
- 确保所有用户输入都被正确验证和清理
### 工具使用9条
- 尽可能并行执行独立的工具调用
- 使用专用工具而非通用 Shell 命令进行文件操作
- 避免陷入重复调用工具而没有进展的循环,适时向用户求助
## Key Concepts
- [[系统提示词]]定义AI角色身份和行为规范的最高层Prompt
- [[提示词工程]] ← extends ← [[系统提示词]]
- [[系统提示词]]:定义 AI 编码助手行为准则的 Prompt分为身份/沟通/任务/技术/安全/工具六大维度
- [[95条原则清单]]AI 编码助手系统提示词的完整检查清单
- [[vibe-coding-cn]]GitHub 上的 Vibe Coding 中文社区项目
## Connections
- [[提示词框架]] ← relates_to ← [[系统提示词]]
- [[Prompt能力]] ← relates_to ← [[系统提示词]]
- [[系统提示词]] ← is_blueprint_for ← [[Claude Code]]
- [[系统提示词]] ← is_blueprint_for ← [[GitHub Copilot]]
## Contradictions
- (无已知冲突)