nexus/wiki/overview.md

---
title: Wiki Overview
last_updated: 2026-04-15
// 新增领域：递归自优化生成系统（2026-04-15）
// 新增领域：AI产品经理工作流（2026-04-15）
// 新增领域：baoyu-skills Claude Code技能集（2026-04-15）
---

# LLM Wiki Overview

## 核心主题
AI开源生态在2025年取得突破性进展，国产模型在多个领域成为国际闭源产品的有力替代。同时，DevOps 文化与转型方法论为组织提供数字化交付能力建设的系统性指导。

## 主要领域
1. **大语言模型**：DeepSeek R1、Qwen 3等国产模型在深度推理和工具调用上达到世界领先水平
2. **AI生图**：Flux和Stable Diffusion主导开源生态，Flux在人体解剖学正确性上表现最佳
3. **AI生视频**：HunyuanVideo以最大参数量成为开源视频生成标杆
4. **通用智能体**：Manus定义AI Agent元年，OpenManus提供开源实现
5. **AI编程**：Cline将VS Code变身全自动AI工程师
6. **智能体工作流**：n8n（16万Star）和Dify实现可视化AI流程编排
7. **AI搜索**：Perplexica实现完全本地化的开源搜索
8. **DevOps 文化与转型**：四大支柱驱动组织数字化交付能力

## 关键趋势
- 深度推理让AI学会"慢思考"
- 开源内卷将价格打成白菜价
- 国产开源模型在多个领域实现差异化竞争
- DevOps 向 GitOps、AI 赋能、Serverless 和 Edge Computing 方向演进

## 新增领域：Claude Skills 与流程工程

Claude Skills 的爆发标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP，将人类经验封装为可复用工作流。Anthropic 官方 Skills 仓库（github.com/anthropics/skills）收藏数突破 3.2 万，包含生产级 Skills：办公自动化、开发者工具箱、创意类 Skill。Vibe Coding 的尽头也是 Skills。

### 关键概念
- [[AI技能封装]]：将固定流程任务拆解为 AI 可理解的结构化流程
- [[流程工程]]：将经验沉淀为 SOP 再交给 AI 稳定执行的新范式
- [[Anthropic]] ← 发布方

### 资源生态
- 三大 Awesome 仓库：ComposioHQ、VoltAgent、BehiSecc
- 三大聚合站：skillsmp.com、aitmpl.com、claudemarketplaces.com

## 新增领域：NotebookLM 与 Source-Grounding

NotebookLM 通过 Source-Grounding 机制（严格限制知识库仅含上传文档）实现高精度回答，每个答案附带精确引文。可作为被动学习（Audio Overviews）、项目管理、法律文档审查、软件更新对比等多种场景的 AI 助理。

### 关键能力
- [[Source Grounding]]：消除幻觉，确保回答可溯源
- [[被动学习]]：Audio Overviews 在碎片时间消费复杂信息
- [[引文追溯]]：每个回答附带原文引文

## 新增领域：AI图生视频

2025年底，AI图生视频技术快速成熟，14款免费工具已能生成高质量视频，覆盖电商模特、内容创作、广告制作等多场景。

### 主要产品
- 绘蛙AI视频（阿里巴巴）：模特图转视频，操作简便
- 智谱清影（智谱AI）：30秒生成6秒高清视频，支持风格选择
- Vidu（生数科技+清华大学）：全球首个"多主体参考"功能
- 可灵AI（快手）：3D时空联合注意力，物理逻辑动作生成
- 海螺AI（MiniMax）：主体一致性保持，光影色调高度一致
- Stable Video（Stability AI）：LoRA摄像机精细控制

### 关键能力
- [[图生视频]]：静态图片转动态视频
- [[主体一致性]]：视频中保持角色外观一致
- [[运动控制]]：文本提示词控制主体运动
- [[运镜控制]]：模拟摄像机运动控制画面视角

## 新增领域：DevOps 文化与转型

### 核心框架
DevOps 建立在四大支柱之上：协作优先于孤岛、自动化即赋能者、持续改进（Kaizen）、客户中心。

### 关键实践
- [[CI/CD Pipelines]]：自动化构建、测试、部署流水线（Jenkins、GitHub Actions、GitLab CI）
- [[Infrastructure as Code]]：以代码管理基础设施（Terraform、AWS CloudFormation）
- [[DevSecOps]]：在 CI/CD 中内置安全（SonarQube、Snyk）
- [[GitOps]]：以 Git 为单一真实源管理配置

### 工具生态
- 监控可观测性：Prometheus、Grafana、Datadog
- 容器化：Docker、Kubernetes
- 配置管理：Ansible（Red Hat）

### 未来趋势
- AI/ML 赋能 DevOps（代码审查智能自动化、异常检测、自愈基础设施）
- [[Serverless DevOps]]：FaaS 减少运维开销
- [[Edge Computing DevOps]]：边缘节点实时应用优化

## 新增领域：Nano Banana 结构化提示词框架

Google Nano Banana 是图像生成提示词的结构化框架，通过 9 个标准化字段（Shot/Subject/Environment/Lighting/Camera/ColorGrade/Style/Quality/Negatives）将创意描述转化为机器可执行参数。

### 关键机制
- negatives（负向提示词）是质量控制关键字段
- camera 字段提供电影级构图控制（焦距/光圈/角度）
- 物件描述框架与人物描述框架共用同一结构，subject 字段内容不同

### 关键概念
- [[Nano Banana]]：Google 发布的结构化图像提示词框架
- [[负向提示词]]：明确排除不需要的特征

## 新增领域：Claude + n8n-mcp AI 工作流自动生成

Claude 与 n8n-mcp 结合，通过自然语言直接生成 n8n 工作流，降低自动化门槛。

### 核心机制
- [[n8n mcp]]：提供 543 个 n8n 节点的结构化访问，271 个 AI 能力节点
- Claude 自动生成工作流完成度约 80%-90%，10%-20% 错误率需人工修正
- 选择 Opensea 模型并开启 extended thinking 可显著提升生成质量

### 关键能力
- [[AI工作流自动生成]]：自然语言→工作流代码
- [[n8n mcp]]：AI 与 n8n 的 MCP 协议桥接

## 新增领域：MCP 在 Cursor 中的集成

MCP 协议为 Cursor 提供与大模型外围服务的高效集成能力。

### 核心机制
- [[MCP]]：Client-Server 架构，3 种接口（资源读取/工具调用/Promise 提示词）
- [[Composer]]：Cursor 对话模块，支持 Agent 模式和 Normal 模式
- [[Agent模式]]：自动执行 MCP 工具链，减少手动操作
- [[Sequential Thinking]]：逻辑推理分步工具，提升 AI 决策质量

### 关键区分
- Agent 模式：工具链自动串联
- Normal 模式：需手动复制命令
- enable yolo mode：风险高，默认关闭

## 新增领域：Google 5 种 Agent Skill 设计模式

Google Cloud 发布的 Skill 内容结构化设计模式，解决 SKILL.md 格式标准化后执行效果差异大的问题。

### 5 种模式
- [[Tool Wrapper]]：监听关键词动态加载规范文档，适合团队编码规范分发
- [[Generator]]：通过"填空"流程强制一致输出格式
- [[Reviewer]]：分离检查清单与检查逻辑，换清单即换审计类型
- [[Inversion]]：agent 先问你再做，逐阶段收集信息
- [[Pipeline]]：带硬性检查点的严格顺序工作流

### Anthropic 补充
- 最好的 Skill = 工具箱，而非"写好的提示词"
- 写 Skill 三条铁律：只写 Agent 不知道的、重点写踩坑清单、给工具不给指令
- 5 种模式可组合（Pipeline 包含 Reviewer、Generator 依赖 Inversion）

### 关键能力
- [[渐进式披露]]：ADK 机制，agent 只在需要时才加载特定 token

## 新增领域：Claude Code 调用模式

OpenClaw/Hermes 通过 terminal 工具调用 Claude Code，两种核心模式满足不同场景需求。

### 关键机制
- [[Print Mode]]：stdin 管道非交互模式，适合绝大多数编程任务
- [[TMUX交互模式]]：tmux session 交互模式，适合超长任务
- `--permission-mode bypassPermissions` 跳过所有交互确认，是自动化调用的必要条件
- `--add-dir` 自动扫描 SKILL.md 并在触发条件匹配时激活

### 关键区分
- delegate_task 仅调用 Hermes 子 agent，无法建立 Claude Code CLI 通道
- Skill 调用必须使用 terminal + claude -p

## 新增领域：baoyu-skills Claude Code 技能集

宝玉发布的 Claude Code 技能集，通过 ClawHub 协议支持按单个 skill 安装，涵盖内容生成、AI 图像创作、日常效率工具三大类。

### 技能架构
- [[内容技能]]：baoyu-xhs-images（小红书9×6风格布局）、baoyu-infographic（20×17布局风格）、baoyu-cover-image（5维封面定制）、baoyu-slide-deck（4维度16预设）、baoyu-comic（5×8画风基调）、baoyu-article-illustrator
- [[baoyu-imagine]]：9 家服务商自动选择（OpenAI/Google/DashScope/MiniMax/即梦/豆包/Replicate等）
- [[工具技能]]：baoyu-translate（三模式翻译）、baoyu-youtube-transcript、baoyu-url-to-markdown

### 发布协议
- ClawHub 按单个 skill 安装（clawhub install baoyu-imagine），而非 marketplace 批量安装
- EXTEND.md 支持用户级/项目级自定义，Env 配置支持 API Key 优先级覆盖

## 新增领域：AI 产品经理工作流

AI 时代产品经理将 Gemini 深度嵌入需求文档、FeatureList、逻辑图、HTML 原型的全链路工作流。

### 核心方法
- [[FeatureList]] 共创：与 Gemini 构思需求框架，AI 补全层级和边界场景
- [[PRD自动生成]]：分页面逐一描述 + PRD 写作指南模板 + 调教反馈
- Mermaid 代码生成 ER 图、泳道图、甘特图（飞书原生支持）
- HTML 原型同步生成 + 差量维护 = 永远最新的交互原型库

### 核心洞察
- Gemini = 知识渊博但不带脑子的苦工，表述越准执行越准
- [[超级个体]] = 某领域八九十分 + AI 横向扩展，AI 是充分非必要条件
- 市场洞察力 = 产品经理最稀缺也最重要的能力，AI 时代更重要

## 新增领域：递归自优化生成系统的形式化框架

tuuai 提出的自递归优化生成系统，将 AI 自我改进机制纳入固定点语义与 λ-calculus 的数学框架。

### 核心机制
- α-提示词（生成器 G）→ Ω-提示词（优化器 O）→ 元生成器（M）→ 自映射 Φ(G) = M(G, O(G(I), Ω))
- 稳定生成能力 = Φ 的固定点 G*：Φ(G*) = G*
- 自举（Bootstrapping）：用优化产物反馈给系统，启动下一轮进化
- Y Combinator 表达：G* = Y STEP，满足 G* = STEP G*

### 关键命题
- 自优化的目标不是单次最优输出，而是生成器空间 {G_n} 的收敛行为
- [[固定点]] 对应系统不动点，即自洽的稳定生成能力
- [[自递归优化生成系统]] 与 Agent Skill Generator Pattern 形成理论与实践的对应

## 新增领域：LLM 核心术语与技术框架

LLM 技术栈从模型到应用形成完整体系，涵盖参数规模基准、工具调用协议、推理优化等多个维度。

### 核心概念
- [[LLM]]：≥1B 参数的语言模型为"大模型"门槛，GPT-2（1.5B）、GPT-3（175B）
- [[MCP]]：Model Context Protocol，LLM 与外部工具的标准化通信协议
- [[Agent]]：大模型 + MCP 工具整合后实现实际任务执行，大模型仅输出步骤，执行需依赖 MCP
- [[RAG]]：Retrieval-augmented generation，通过检索增强解决幻觉问题（考试正确率 60%→90%）
- [[Embedding]]：向量化，将词转化为浮点数字计算语义距离
- [[vLLM]]：通过 PagedAttention（块式 KV Cache）和连续批处理优化 GPU 利用率
- [[Token]]：LLM 基本输入单元，中文约 0.6 token/字符，英文约 0.3 token/字符
- [[数据蒸馏]]：用大模型生成精简数据训练小模型

### 关键洞察
- MCP 协议核心约束：大模型不执行实际调用，只给出步骤建议
- vLLM 推理优化：PagedAttention 避免内存碎片化，连续批处理减少头阻塞

## 新增领域：Vibe Coding 氛围编程

Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行，让想法到可维护代码成为可审计流水线。

### 核心方法论
- 开发者从"写代码的人"转变为"指挥 AI 写代码的导演"
- 保持对产品逻辑、用户流程、审美和交互的"感觉"
- 规划是一切：技术选型、实施规划、模块化设计
- AI 工具（Cursor、Windsurf、Trae）承担体力活

### 推荐资源
- [[vibe coding cn]]：中文开发者 Vibe Coding 资源库与工作站
- Cursor + claude-opus-4.5-xhigh 为推荐工具组合

## 新增领域：Agentic AI 赋能 Cloud DevOps

Agentic AI 将传统响应式 DevOps 转变为预测性、自动化运维。

### 七大应用场景
1. 自主检测与修复：K8s、数据库、存储异常自动修复（MTTR 降低）
2. 智能 IaC 管理：审查 Terraform、CloudFormation、Pulumi 脚本
3. 成本优化：动态扩展、Spot/Reserved 实例优化（夜间负载转移降低 40% 成本）
4. 安全合规：IAM 策略扫描、容器漏洞检测、实时修复
5. 日志分析与可观测性：AI 驱动的根因分析
6. 多租户 SaaS 管理：自动化创建、配置、归档租户
7. AI 增强决策：What-If 模拟、异常检测

### 关键能力
- [[Self-Healing Systems]]：自愈系统，异常检测 + 自动修复
- [[Multi-Cloud Governance]]：跨 AWS/GCP/Azure 多云治理

## 新增领域：OpenClaw Workspace 架构

OpenClaw workspace 文件体系通过 7 个核心文件实现 Agent 的可预期性和一致性。

### 核心文件
- AGENTS.md：岗位职责说明书（300-500 字最佳），定义边界而非仅列能力
- SOUL.md：性格档案（叙事性角色设定），与 IDENTITY.md 分工明确
- USER.md：用户偏好固化，减少重复交代
- TOOLS.md：工具权限规范，核心是"什么时候不用"
- IDENTITY.md：结构化身份元数据（Name/Creature/Vibe/Emoji/Avatar）
- BOOTSTRAP.md：一次性初始化引导，完成后删除
- [[长期记忆]]：memory/ 目录，Agent 跨会话保留重要信息

### 核心价值
从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。