272 lines
13 KiB
Markdown
272 lines
13 KiB
Markdown
---
|
||
title: Wiki Overview
|
||
last_updated: 2026-04-15
|
||
// 新增领域:递归自优化生成系统(2026-04-15)
|
||
// 新增领域:AI产品经理工作流(2026-04-15)
|
||
// 新增领域:baoyu-skills Claude Code技能集(2026-04-15)
|
||
---
|
||
|
||
# LLM Wiki Overview
|
||
|
||
## 核心主题
|
||
AI开源生态在2025年取得突破性进展,国产模型在多个领域成为国际闭源产品的有力替代。同时,DevOps 文化与转型方法论为组织提供数字化交付能力建设的系统性指导。
|
||
|
||
## 主要领域
|
||
1. **大语言模型**:DeepSeek R1、Qwen 3等国产模型在深度推理和工具调用上达到世界领先水平
|
||
2. **AI生图**:Flux和Stable Diffusion主导开源生态,Flux在人体解剖学正确性上表现最佳
|
||
3. **AI生视频**:HunyuanVideo以最大参数量成为开源视频生成标杆
|
||
4. **通用智能体**:Manus定义AI Agent元年,OpenManus提供开源实现
|
||
5. **AI编程**:Cline将VS Code变身全自动AI工程师
|
||
6. **智能体工作流**:n8n(16万Star)和Dify实现可视化AI流程编排
|
||
7. **AI搜索**:Perplexica实现完全本地化的开源搜索
|
||
8. **DevOps 文化与转型**:四大支柱驱动组织数字化交付能力
|
||
|
||
## 关键趋势
|
||
- 深度推理让AI学会"慢思考"
|
||
- 开源内卷将价格打成白菜价
|
||
- 国产开源模型在多个领域实现差异化竞争
|
||
- DevOps 向 GitOps、AI 赋能、Serverless 和 Edge Computing 方向演进
|
||
|
||
## 新增领域:Claude Skills 与流程工程
|
||
|
||
Claude Skills 的爆发标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP,将人类经验封装为可复用工作流。Anthropic 官方 Skills 仓库(github.com/anthropics/skills)收藏数突破 3.2 万,包含生产级 Skills:办公自动化、开发者工具箱、创意类 Skill。Vibe Coding 的尽头也是 Skills。
|
||
|
||
### 关键概念
|
||
- [[AI技能封装]]:将固定流程任务拆解为 AI 可理解的结构化流程
|
||
- [[流程工程]]:将经验沉淀为 SOP 再交给 AI 稳定执行的新范式
|
||
- [[Anthropic]] ← 发布方
|
||
|
||
### 资源生态
|
||
- 三大 Awesome 仓库:ComposioHQ、VoltAgent、BehiSecc
|
||
- 三大聚合站:skillsmp.com、aitmpl.com、claudemarketplaces.com
|
||
|
||
## 新增领域:NotebookLM 与 Source-Grounding
|
||
|
||
NotebookLM 通过 Source-Grounding 机制(严格限制知识库仅含上传文档)实现高精度回答,每个答案附带精确引文。可作为被动学习(Audio Overviews)、项目管理、法律文档审查、软件更新对比等多种场景的 AI 助理。
|
||
|
||
### 关键能力
|
||
- [[Source Grounding]]:消除幻觉,确保回答可溯源
|
||
- [[被动学习]]:Audio Overviews 在碎片时间消费复杂信息
|
||
- [[引文追溯]]:每个回答附带原文引文
|
||
|
||
## 新增领域:AI图生视频
|
||
|
||
2025年底,AI图生视频技术快速成熟,14款免费工具已能生成高质量视频,覆盖电商模特、内容创作、广告制作等多场景。
|
||
|
||
### 主要产品
|
||
- 绘蛙AI视频(阿里巴巴):模特图转视频,操作简便
|
||
- 智谱清影(智谱AI):30秒生成6秒高清视频,支持风格选择
|
||
- Vidu(生数科技+清华大学):全球首个"多主体参考"功能
|
||
- 可灵AI(快手):3D时空联合注意力,物理逻辑动作生成
|
||
- 海螺AI(MiniMax):主体一致性保持,光影色调高度一致
|
||
- Stable Video(Stability AI):LoRA摄像机精细控制
|
||
|
||
### 关键能力
|
||
- [[图生视频]]:静态图片转动态视频
|
||
- [[主体一致性]]:视频中保持角色外观一致
|
||
- [[运动控制]]:文本提示词控制主体运动
|
||
- [[运镜控制]]:模拟摄像机运动控制画面视角
|
||
|
||
## 新增领域:DevOps 文化与转型
|
||
|
||
### 核心框架
|
||
DevOps 建立在四大支柱之上:协作优先于孤岛、自动化即赋能者、持续改进(Kaizen)、客户中心。
|
||
|
||
### 关键实践
|
||
- [[CI/CD Pipelines]]:自动化构建、测试、部署流水线(Jenkins、GitHub Actions、GitLab CI)
|
||
- [[Infrastructure as Code]]:以代码管理基础设施(Terraform、AWS CloudFormation)
|
||
- [[DevSecOps]]:在 CI/CD 中内置安全(SonarQube、Snyk)
|
||
- [[GitOps]]:以 Git 为单一真实源管理配置
|
||
|
||
### 工具生态
|
||
- 监控可观测性:Prometheus、Grafana、Datadog
|
||
- 容器化:Docker、Kubernetes
|
||
- 配置管理:Ansible(Red Hat)
|
||
|
||
### 未来趋势
|
||
- AI/ML 赋能 DevOps(代码审查智能自动化、异常检测、自愈基础设施)
|
||
- [[Serverless DevOps]]:FaaS 减少运维开销
|
||
- [[Edge Computing DevOps]]:边缘节点实时应用优化
|
||
|
||
## 新增领域:Nano Banana 结构化提示词框架
|
||
|
||
Google Nano Banana 是图像生成提示词的结构化框架,通过 9 个标准化字段(Shot/Subject/Environment/Lighting/Camera/ColorGrade/Style/Quality/Negatives)将创意描述转化为机器可执行参数。
|
||
|
||
### 关键机制
|
||
- negatives(负向提示词)是质量控制关键字段
|
||
- camera 字段提供电影级构图控制(焦距/光圈/角度)
|
||
- 物件描述框架与人物描述框架共用同一结构,subject 字段内容不同
|
||
|
||
### 关键概念
|
||
- [[Nano Banana]]:Google 发布的结构化图像提示词框架
|
||
- [[负向提示词]]:明确排除不需要的特征
|
||
|
||
## 新增领域:Claude + n8n-mcp AI 工作流自动生成
|
||
|
||
Claude 与 n8n-mcp 结合,通过自然语言直接生成 n8n 工作流,降低自动化门槛。
|
||
|
||
### 核心机制
|
||
- [[n8n mcp]]:提供 543 个 n8n 节点的结构化访问,271 个 AI 能力节点
|
||
- Claude 自动生成工作流完成度约 80%-90%,10%-20% 错误率需人工修正
|
||
- 选择 Opensea 模型并开启 extended thinking 可显著提升生成质量
|
||
|
||
### 关键能力
|
||
- [[AI工作流自动生成]]:自然语言→工作流代码
|
||
- [[n8n mcp]]:AI 与 n8n 的 MCP 协议桥接
|
||
|
||
## 新增领域:MCP 在 Cursor 中的集成
|
||
|
||
MCP 协议为 Cursor 提供与大模型外围服务的高效集成能力。
|
||
|
||
### 核心机制
|
||
- [[MCP]]:Client-Server 架构,3 种接口(资源读取/工具调用/Promise 提示词)
|
||
- [[Composer]]:Cursor 对话模块,支持 Agent 模式和 Normal 模式
|
||
- [[Agent模式]]:自动执行 MCP 工具链,减少手动操作
|
||
- [[Sequential Thinking]]:逻辑推理分步工具,提升 AI 决策质量
|
||
|
||
### 关键区分
|
||
- Agent 模式:工具链自动串联
|
||
- Normal 模式:需手动复制命令
|
||
- enable yolo mode:风险高,默认关闭
|
||
|
||
## 新增领域:Google 5 种 Agent Skill 设计模式
|
||
|
||
Google Cloud 发布的 Skill 内容结构化设计模式,解决 SKILL.md 格式标准化后执行效果差异大的问题。
|
||
|
||
### 5 种模式
|
||
- [[Tool Wrapper]]:监听关键词动态加载规范文档,适合团队编码规范分发
|
||
- [[Generator]]:通过"填空"流程强制一致输出格式
|
||
- [[Reviewer]]:分离检查清单与检查逻辑,换清单即换审计类型
|
||
- [[Inversion]]:agent 先问你再做,逐阶段收集信息
|
||
- [[Pipeline]]:带硬性检查点的严格顺序工作流
|
||
|
||
### Anthropic 补充
|
||
- 最好的 Skill = 工具箱,而非"写好的提示词"
|
||
- 写 Skill 三条铁律:只写 Agent 不知道的、重点写踩坑清单、给工具不给指令
|
||
- 5 种模式可组合(Pipeline 包含 Reviewer、Generator 依赖 Inversion)
|
||
|
||
### 关键能力
|
||
- [[渐进式披露]]:ADK 机制,agent 只在需要时才加载特定 token
|
||
|
||
## 新增领域:Claude Code 调用模式
|
||
|
||
OpenClaw/Hermes 通过 terminal 工具调用 Claude Code,两种核心模式满足不同场景需求。
|
||
|
||
### 关键机制
|
||
- [[Print Mode]]:stdin 管道非交互模式,适合绝大多数编程任务
|
||
- [[TMUX交互模式]]:tmux session 交互模式,适合超长任务
|
||
- `--permission-mode bypassPermissions` 跳过所有交互确认,是自动化调用的必要条件
|
||
- `--add-dir` 自动扫描 SKILL.md 并在触发条件匹配时激活
|
||
|
||
### 关键区分
|
||
- delegate_task 仅调用 Hermes 子 agent,无法建立 Claude Code CLI 通道
|
||
- Skill 调用必须使用 terminal + claude -p
|
||
|
||
## 新增领域:baoyu-skills Claude Code 技能集
|
||
|
||
宝玉发布的 Claude Code 技能集,通过 ClawHub 协议支持按单个 skill 安装,涵盖内容生成、AI 图像创作、日常效率工具三大类。
|
||
|
||
### 技能架构
|
||
- [[内容技能]]:baoyu-xhs-images(小红书9×6风格布局)、baoyu-infographic(20×17布局风格)、baoyu-cover-image(5维封面定制)、baoyu-slide-deck(4维度16预设)、baoyu-comic(5×8画风基调)、baoyu-article-illustrator
|
||
- [[baoyu-imagine]]:9 家服务商自动选择(OpenAI/Google/DashScope/MiniMax/即梦/豆包/Replicate等)
|
||
- [[工具技能]]:baoyu-translate(三模式翻译)、baoyu-youtube-transcript、baoyu-url-to-markdown
|
||
|
||
### 发布协议
|
||
- ClawHub 按单个 skill 安装(clawhub install baoyu-imagine),而非 marketplace 批量安装
|
||
- EXTEND.md 支持用户级/项目级自定义,Env 配置支持 API Key 优先级覆盖
|
||
|
||
## 新增领域:AI 产品经理工作流
|
||
|
||
AI 时代产品经理将 Gemini 深度嵌入需求文档、FeatureList、逻辑图、HTML 原型的全链路工作流。
|
||
|
||
### 核心方法
|
||
- [[FeatureList]] 共创:与 Gemini 构思需求框架,AI 补全层级和边界场景
|
||
- [[PRD自动生成]]:分页面逐一描述 + PRD 写作指南模板 + 调教反馈
|
||
- Mermaid 代码生成 ER 图、泳道图、甘特图(飞书原生支持)
|
||
- HTML 原型同步生成 + 差量维护 = 永远最新的交互原型库
|
||
|
||
### 核心洞察
|
||
- Gemini = 知识渊博但不带脑子的苦工,表述越准执行越准
|
||
- [[超级个体]] = 某领域八九十分 + AI 横向扩展,AI 是充分非必要条件
|
||
- 市场洞察力 = 产品经理最稀缺也最重要的能力,AI 时代更重要
|
||
|
||
## 新增领域:递归自优化生成系统的形式化框架
|
||
|
||
tuuai 提出的自递归优化生成系统,将 AI 自我改进机制纳入固定点语义与 λ-calculus 的数学框架。
|
||
|
||
### 核心机制
|
||
- α-提示词(生成器 G)→ Ω-提示词(优化器 O)→ 元生成器(M)→ 自映射 Φ(G) = M(G, O(G(I), Ω))
|
||
- 稳定生成能力 = Φ 的固定点 G*:Φ(G*) = G*
|
||
- 自举(Bootstrapping):用优化产物反馈给系统,启动下一轮进化
|
||
- Y Combinator 表达:G* = Y STEP,满足 G* = STEP G*
|
||
|
||
### 关键命题
|
||
- 自优化的目标不是单次最优输出,而是生成器空间 {G_n} 的收敛行为
|
||
- [[固定点]] 对应系统不动点,即自洽的稳定生成能力
|
||
- [[自递归优化生成系统]] 与 Agent Skill Generator Pattern 形成理论与实践的对应
|
||
|
||
## 新增领域:LLM 核心术语与技术框架
|
||
|
||
LLM 技术栈从模型到应用形成完整体系,涵盖参数规模基准、工具调用协议、推理优化等多个维度。
|
||
|
||
### 核心概念
|
||
- [[LLM]]:≥1B 参数的语言模型为"大模型"门槛,GPT-2(1.5B)、GPT-3(175B)
|
||
- [[MCP]]:Model Context Protocol,LLM 与外部工具的标准化通信协议
|
||
- [[Agent]]:大模型 + MCP 工具整合后实现实际任务执行,大模型仅输出步骤,执行需依赖 MCP
|
||
- [[RAG]]:Retrieval-augmented generation,通过检索增强解决幻觉问题(考试正确率 60%→90%)
|
||
- [[Embedding]]:向量化,将词转化为浮点数字计算语义距离
|
||
- [[vLLM]]:通过 PagedAttention(块式 KV Cache)和连续批处理优化 GPU 利用率
|
||
- [[Token]]:LLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符
|
||
- [[数据蒸馏]]:用大模型生成精简数据训练小模型
|
||
|
||
### 关键洞察
|
||
- MCP 协议核心约束:大模型不执行实际调用,只给出步骤建议
|
||
- vLLM 推理优化:PagedAttention 避免内存碎片化,连续批处理减少头阻塞
|
||
|
||
## 新增领域:Vibe Coding 氛围编程
|
||
|
||
Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行,让想法到可维护代码成为可审计流水线。
|
||
|
||
### 核心方法论
|
||
- 开发者从"写代码的人"转变为"指挥 AI 写代码的导演"
|
||
- 保持对产品逻辑、用户流程、审美和交互的"感觉"
|
||
- 规划是一切:技术选型、实施规划、模块化设计
|
||
- AI 工具(Cursor、Windsurf、Trae)承担体力活
|
||
|
||
### 推荐资源
|
||
- [[vibe coding cn]]:中文开发者 Vibe Coding 资源库与工作站
|
||
- Cursor + claude-opus-4.5-xhigh 为推荐工具组合
|
||
|
||
## 新增领域:Agentic AI 赋能 Cloud DevOps
|
||
|
||
Agentic AI 将传统响应式 DevOps 转变为预测性、自动化运维。
|
||
|
||
### 七大应用场景
|
||
1. 自主检测与修复:K8s、数据库、存储异常自动修复(MTTR 降低)
|
||
2. 智能 IaC 管理:审查 Terraform、CloudFormation、Pulumi 脚本
|
||
3. 成本优化:动态扩展、Spot/Reserved 实例优化(夜间负载转移降低 40% 成本)
|
||
4. 安全合规:IAM 策略扫描、容器漏洞检测、实时修复
|
||
5. 日志分析与可观测性:AI 驱动的根因分析
|
||
6. 多租户 SaaS 管理:自动化创建、配置、归档租户
|
||
7. AI 增强决策:What-If 模拟、异常检测
|
||
|
||
### 关键能力
|
||
- [[Self-Healing Systems]]:自愈系统,异常检测 + 自动修复
|
||
- [[Multi-Cloud Governance]]:跨 AWS/GCP/Azure 多云治理
|
||
|
||
## 新增领域:OpenClaw Workspace 架构
|
||
|
||
OpenClaw workspace 文件体系通过 7 个核心文件实现 Agent 的可预期性和一致性。
|
||
|
||
### 核心文件
|
||
- AGENTS.md:岗位职责说明书(300-500 字最佳),定义边界而非仅列能力
|
||
- SOUL.md:性格档案(叙事性角色设定),与 IDENTITY.md 分工明确
|
||
- USER.md:用户偏好固化,减少重复交代
|
||
- TOOLS.md:工具权限规范,核心是"什么时候不用"
|
||
- IDENTITY.md:结构化身份元数据(Name/Creature/Vibe/Emoji/Avatar)
|
||
- BOOTSTRAP.md:一次性初始化引导,完成后删除
|
||
- [[长期记忆]]:memory/ 目录,Agent 跨会话保留重要信息
|
||
|
||
### 核心价值
|
||
从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。
|