Files
nexus/wiki/overview.md
2026-04-15 16:33:26 +08:00

272 lines
13 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: Wiki Overview
last_updated: 2026-04-15
// 新增领域递归自优化生成系统2026-04-15
// 新增领域AI产品经理工作流2026-04-15
// 新增领域baoyu-skills Claude Code技能集2026-04-15
---
# LLM Wiki Overview
## 核心主题
AI开源生态在2025年取得突破性进展国产模型在多个领域成为国际闭源产品的有力替代。同时DevOps 文化与转型方法论为组织提供数字化交付能力建设的系统性指导。
## 主要领域
1. **大语言模型**DeepSeek R1、Qwen 3等国产模型在深度推理和工具调用上达到世界领先水平
2. **AI生图**Flux和Stable Diffusion主导开源生态Flux在人体解剖学正确性上表现最佳
3. **AI生视频**HunyuanVideo以最大参数量成为开源视频生成标杆
4. **通用智能体**Manus定义AI Agent元年OpenManus提供开源实现
5. **AI编程**Cline将VS Code变身全自动AI工程师
6. **智能体工作流**n8n16万Star和Dify实现可视化AI流程编排
7. **AI搜索**Perplexica实现完全本地化的开源搜索
8. **DevOps 文化与转型**:四大支柱驱动组织数字化交付能力
## 关键趋势
- 深度推理让AI学会"慢思考"
- 开源内卷将价格打成白菜价
- 国产开源模型在多个领域实现差异化竞争
- DevOps 向 GitOps、AI 赋能、Serverless 和 Edge Computing 方向演进
## 新增领域Claude Skills 与流程工程
Claude Skills 的爆发标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP将人类经验封装为可复用工作流。Anthropic 官方 Skills 仓库github.com/anthropics/skills收藏数突破 3.2 万,包含生产级 Skills办公自动化、开发者工具箱、创意类 Skill。Vibe Coding 的尽头也是 Skills。
### 关键概念
- [[AI技能封装]]:将固定流程任务拆解为 AI 可理解的结构化流程
- [[流程工程]]:将经验沉淀为 SOP 再交给 AI 稳定执行的新范式
- [[Anthropic]] ← 发布方
### 资源生态
- 三大 Awesome 仓库ComposioHQ、VoltAgent、BehiSecc
- 三大聚合站skillsmp.com、aitmpl.com、claudemarketplaces.com
## 新增领域NotebookLM 与 Source-Grounding
NotebookLM 通过 Source-Grounding 机制严格限制知识库仅含上传文档实现高精度回答每个答案附带精确引文。可作为被动学习Audio Overviews、项目管理、法律文档审查、软件更新对比等多种场景的 AI 助理。
### 关键能力
- [[Source Grounding]]:消除幻觉,确保回答可溯源
- [[被动学习]]Audio Overviews 在碎片时间消费复杂信息
- [[引文追溯]]:每个回答附带原文引文
## 新增领域AI图生视频
2025年底AI图生视频技术快速成熟14款免费工具已能生成高质量视频覆盖电商模特、内容创作、广告制作等多场景。
### 主要产品
- 绘蛙AI视频阿里巴巴模特图转视频操作简便
- 智谱清影智谱AI30秒生成6秒高清视频支持风格选择
- Vidu生数科技+清华大学):全球首个"多主体参考"功能
- 可灵AI快手3D时空联合注意力物理逻辑动作生成
- 海螺AIMiniMax主体一致性保持光影色调高度一致
- Stable VideoStability AILoRA摄像机精细控制
### 关键能力
- [[图生视频]]:静态图片转动态视频
- [[主体一致性]]:视频中保持角色外观一致
- [[运动控制]]:文本提示词控制主体运动
- [[运镜控制]]:模拟摄像机运动控制画面视角
## 新增领域DevOps 文化与转型
### 核心框架
DevOps 建立在四大支柱之上协作优先于孤岛、自动化即赋能者、持续改进Kaizen、客户中心。
### 关键实践
- [[CI/CD Pipelines]]自动化构建、测试、部署流水线Jenkins、GitHub Actions、GitLab CI
- [[Infrastructure as Code]]以代码管理基础设施Terraform、AWS CloudFormation
- [[DevSecOps]]:在 CI/CD 中内置安全SonarQube、Snyk
- [[GitOps]]:以 Git 为单一真实源管理配置
### 工具生态
- 监控可观测性Prometheus、Grafana、Datadog
- 容器化Docker、Kubernetes
- 配置管理AnsibleRed Hat
### 未来趋势
- AI/ML 赋能 DevOps代码审查智能自动化、异常检测、自愈基础设施
- [[Serverless DevOps]]FaaS 减少运维开销
- [[Edge Computing DevOps]]:边缘节点实时应用优化
## 新增领域Nano Banana 结构化提示词框架
Google Nano Banana 是图像生成提示词的结构化框架,通过 9 个标准化字段Shot/Subject/Environment/Lighting/Camera/ColorGrade/Style/Quality/Negatives将创意描述转化为机器可执行参数。
### 关键机制
- negatives负向提示词是质量控制关键字段
- camera 字段提供电影级构图控制(焦距/光圈/角度)
- 物件描述框架与人物描述框架共用同一结构subject 字段内容不同
### 关键概念
- [[Nano Banana]]Google 发布的结构化图像提示词框架
- [[负向提示词]]:明确排除不需要的特征
## 新增领域Claude + n8n-mcp AI 工作流自动生成
Claude 与 n8n-mcp 结合,通过自然语言直接生成 n8n 工作流,降低自动化门槛。
### 核心机制
- [[n8n mcp]]:提供 543 个 n8n 节点的结构化访问271 个 AI 能力节点
- Claude 自动生成工作流完成度约 80%-90%10%-20% 错误率需人工修正
- 选择 Opensea 模型并开启 extended thinking 可显著提升生成质量
### 关键能力
- [[AI工作流自动生成]]:自然语言→工作流代码
- [[n8n mcp]]AI 与 n8n 的 MCP 协议桥接
## 新增领域MCP 在 Cursor 中的集成
MCP 协议为 Cursor 提供与大模型外围服务的高效集成能力。
### 核心机制
- [[MCP]]Client-Server 架构3 种接口(资源读取/工具调用/Promise 提示词)
- [[Composer]]Cursor 对话模块,支持 Agent 模式和 Normal 模式
- [[Agent模式]]:自动执行 MCP 工具链,减少手动操作
- [[Sequential Thinking]]:逻辑推理分步工具,提升 AI 决策质量
### 关键区分
- Agent 模式:工具链自动串联
- Normal 模式:需手动复制命令
- enable yolo mode风险高默认关闭
## 新增领域Google 5 种 Agent Skill 设计模式
Google Cloud 发布的 Skill 内容结构化设计模式,解决 SKILL.md 格式标准化后执行效果差异大的问题。
### 5 种模式
- [[Tool Wrapper]]:监听关键词动态加载规范文档,适合团队编码规范分发
- [[Generator]]:通过"填空"流程强制一致输出格式
- [[Reviewer]]:分离检查清单与检查逻辑,换清单即换审计类型
- [[Inversion]]agent 先问你再做,逐阶段收集信息
- [[Pipeline]]:带硬性检查点的严格顺序工作流
### Anthropic 补充
- 最好的 Skill = 工具箱,而非"写好的提示词"
- 写 Skill 三条铁律:只写 Agent 不知道的、重点写踩坑清单、给工具不给指令
- 5 种模式可组合Pipeline 包含 Reviewer、Generator 依赖 Inversion
### 关键能力
- [[渐进式披露]]ADK 机制agent 只在需要时才加载特定 token
## 新增领域Claude Code 调用模式
OpenClaw/Hermes 通过 terminal 工具调用 Claude Code两种核心模式满足不同场景需求。
### 关键机制
- [[Print Mode]]stdin 管道非交互模式,适合绝大多数编程任务
- [[TMUX交互模式]]tmux session 交互模式,适合超长任务
- `--permission-mode bypassPermissions` 跳过所有交互确认,是自动化调用的必要条件
- `--add-dir` 自动扫描 SKILL.md 并在触发条件匹配时激活
### 关键区分
- delegate_task 仅调用 Hermes 子 agent无法建立 Claude Code CLI 通道
- Skill 调用必须使用 terminal + claude -p
## 新增领域baoyu-skills Claude Code 技能集
宝玉发布的 Claude Code 技能集,通过 ClawHub 协议支持按单个 skill 安装涵盖内容生成、AI 图像创作、日常效率工具三大类。
### 技能架构
- [[内容技能]]baoyu-xhs-images小红书9×6风格布局、baoyu-infographic20×17布局风格、baoyu-cover-image5维封面定制、baoyu-slide-deck4维度16预设、baoyu-comic5×8画风基调、baoyu-article-illustrator
- [[baoyu-imagine]]9 家服务商自动选择OpenAI/Google/DashScope/MiniMax/即梦/豆包/Replicate等
- [[工具技能]]baoyu-translate三模式翻译、baoyu-youtube-transcript、baoyu-url-to-markdown
### 发布协议
- ClawHub 按单个 skill 安装clawhub install baoyu-imagine而非 marketplace 批量安装
- EXTEND.md 支持用户级/项目级自定义Env 配置支持 API Key 优先级覆盖
## 新增领域AI 产品经理工作流
AI 时代产品经理将 Gemini 深度嵌入需求文档、FeatureList、逻辑图、HTML 原型的全链路工作流。
### 核心方法
- [[FeatureList]] 共创:与 Gemini 构思需求框架AI 补全层级和边界场景
- [[PRD自动生成]]:分页面逐一描述 + PRD 写作指南模板 + 调教反馈
- Mermaid 代码生成 ER 图、泳道图、甘特图(飞书原生支持)
- HTML 原型同步生成 + 差量维护 = 永远最新的交互原型库
### 核心洞察
- Gemini = 知识渊博但不带脑子的苦工,表述越准执行越准
- [[超级个体]] = 某领域八九十分 + AI 横向扩展AI 是充分非必要条件
- 市场洞察力 = 产品经理最稀缺也最重要的能力AI 时代更重要
## 新增领域:递归自优化生成系统的形式化框架
tuuai 提出的自递归优化生成系统,将 AI 自我改进机制纳入固定点语义与 λ-calculus 的数学框架。
### 核心机制
- α-提示词(生成器 G→ Ω-提示词(优化器 O→ 元生成器M→ 自映射 Φ(G) = M(G, O(G(I), Ω))
- 稳定生成能力 = Φ 的固定点 G*:Φ(G*) = G*
- 自举Bootstrapping用优化产物反馈给系统启动下一轮进化
- Y Combinator 表达G* = Y STEP满足 G* = STEP G*
### 关键命题
- 自优化的目标不是单次最优输出,而是生成器空间 {G_n} 的收敛行为
- [[固定点]] 对应系统不动点,即自洽的稳定生成能力
- [[自递归优化生成系统]] 与 Agent Skill Generator Pattern 形成理论与实践的对应
## 新增领域LLM 核心术语与技术框架
LLM 技术栈从模型到应用形成完整体系,涵盖参数规模基准、工具调用协议、推理优化等多个维度。
### 核心概念
- [[LLM]]≥1B 参数的语言模型为"大模型"门槛GPT-21.5B、GPT-3175B
- [[MCP]]Model Context ProtocolLLM 与外部工具的标准化通信协议
- [[Agent]]:大模型 + MCP 工具整合后实现实际任务执行,大模型仅输出步骤,执行需依赖 MCP
- [[RAG]]Retrieval-augmented generation通过检索增强解决幻觉问题考试正确率 60%→90%
- [[Embedding]]:向量化,将词转化为浮点数字计算语义距离
- [[vLLM]]:通过 PagedAttention块式 KV Cache和连续批处理优化 GPU 利用率
- [[Token]]LLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符
- [[数据蒸馏]]:用大模型生成精简数据训练小模型
### 关键洞察
- MCP 协议核心约束:大模型不执行实际调用,只给出步骤建议
- vLLM 推理优化PagedAttention 避免内存碎片化,连续批处理减少头阻塞
## 新增领域Vibe Coding 氛围编程
Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行,让想法到可维护代码成为可审计流水线。
### 核心方法论
- 开发者从"写代码的人"转变为"指挥 AI 写代码的导演"
- 保持对产品逻辑、用户流程、审美和交互的"感觉"
- 规划是一切:技术选型、实施规划、模块化设计
- AI 工具Cursor、Windsurf、Trae承担体力活
### 推荐资源
- [[vibe coding cn]]:中文开发者 Vibe Coding 资源库与工作站
- Cursor + claude-opus-4.5-xhigh 为推荐工具组合
## 新增领域Agentic AI 赋能 Cloud DevOps
Agentic AI 将传统响应式 DevOps 转变为预测性、自动化运维。
### 七大应用场景
1. 自主检测与修复K8s、数据库、存储异常自动修复MTTR 降低)
2. 智能 IaC 管理:审查 Terraform、CloudFormation、Pulumi 脚本
3. 成本优化动态扩展、Spot/Reserved 实例优化(夜间负载转移降低 40% 成本)
4. 安全合规IAM 策略扫描、容器漏洞检测、实时修复
5. 日志分析与可观测性AI 驱动的根因分析
6. 多租户 SaaS 管理:自动化创建、配置、归档租户
7. AI 增强决策What-If 模拟、异常检测
### 关键能力
- [[Self-Healing Systems]]:自愈系统,异常检测 + 自动修复
- [[Multi-Cloud Governance]]:跨 AWS/GCP/Azure 多云治理
## 新增领域OpenClaw Workspace 架构
OpenClaw workspace 文件体系通过 7 个核心文件实现 Agent 的可预期性和一致性。
### 核心文件
- AGENTS.md岗位职责说明书300-500 字最佳),定义边界而非仅列能力
- SOUL.md性格档案叙事性角色设定与 IDENTITY.md 分工明确
- USER.md用户偏好固化减少重复交代
- TOOLS.md工具权限规范核心是"什么时候不用"
- IDENTITY.md结构化身份元数据Name/Creature/Vibe/Emoji/Avatar
- BOOTSTRAP.md一次性初始化引导完成后删除
- [[长期记忆]]memory/ 目录Agent 跨会话保留重要信息
### 核心价值
从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。