Auto-sync

This commit is contained in:
2026-04-15 15:02:52 +08:00
parent bb2f9b2b3a
commit d3e7fcf81f
71 changed files with 2549 additions and 0 deletions

View File

@@ -0,0 +1,29 @@
---
title: "AI工作流自动生成"
type: concept
tags: [ai, workflow-automation, n8n]
last_updated: 2026-04-15
---
# AI工作流自动生成
## 定义
通过自然语言描述需求,由 AI 自动设计并生成工作流代码的过程。
## 核心机制
1. 用户输入自然语言需求描述
2. AI 理解任务目标并选择合适节点
3. AI 自动生成节点连接和配置代码
4. 用户验证并修正错误
## 典型案例
- [[使用Claude自动生成N8N工作流的实操教程]]Claude + n8n-mcp 实现 80%-90% 完成度
## 局限性
- AI 生成工作流约 10%-20% 错误率需人工修正
- 需选择专用模型(如 Opensea和开启 extended thinking 提升质量
## Connections
- [[n8n]]:目标工作流平台
- [[Claude]]:生成执行方
- [[n8n-mcp]]:桥接工具

View File

@@ -0,0 +1,56 @@
---
title: "Agent Skill 设计模式"
type: concept
tags: [agent, skill, design-pattern]
last_updated: 2026-04-15
---
# Agent Skill 设计模式
## 定义
Google 发布的 5 种 Skill 内容结构化设计模式,用于解决 SKILL.md 格式标准化后执行效果差异大的问题。
## 5 种模式
### 1. Tool Wrapper
- **用途**:让 agent 快速成为某个领域专家
- **机制**:监听特定库关键词,动态加载规范文档
- **适用**:团队内部编码规范、特定框架最佳实践
### 2. Generator
- **用途**:从模板生成结构化输出
- **机制**"填空"流程assets/ 模板 + references/ 样式指南
- **适用**:统一 API 文档、标准化 commit 信息、脚手架项目
### 3. Reviewer
- **用途**:把检查清单和检查逻辑分开
- **机制**:审查标准存放在 references/review-checklist.md换清单即换审计类型
- **适用**:代码审查、安全审计、合规检查
### 4. Inversion
- **用途**agent 先问你再做
- **机制**:通过不可协商的门控指令逐阶段收集信息
- **适用**:项目规划、需求收集
### 5. Pipeline
- **用途**:带硬性检查点的严格工作流
- **机制**:明确前置条件和门控条件,强制顺序执行
- **适用**:复杂任务、文档流水线、多阶段生成
## 模式组合
- Pipeline 可包含 Reviewer 步骤double-check 成果)
- Generator 可依赖 Inversion 收集缺失变量
## Anthropic 补充
- 最好的 Skill 不是"写好的提示词",而是"工具箱"
- Skill = 说明书 + SOP
- 写 Skill 三条铁律:只写 Agent 不知道的东西、重点写踩坑清单、给工具不给指令
## Connections
- [[Tool Wrapper]]:模式之一
- [[Generator]]:模式之一
- [[Reviewer]]:模式之一
- [[Inversion]]:模式之一
- [[Pipeline]]:模式之一
- [[渐进式披露]]ADK 机制支撑
- [[AI技能封装]]:相关领域

View File

@@ -0,0 +1,34 @@
---
title: "Agentic AI"
type: concept
tags: [ai-agent, autonomy]
last_updated: 2026-04-15
---
## Definition
能感知环境、做出决策、预判需求并自主采取行动的 AI 系统。与 GenAI生成内容的被动响应不同Agentic AI 强调行动导向,与环境持续交互。
## Core Loop
1. **感知Perceive**:获取任务,扫描环境上下文
2. **思考Reason**:使用 LLM 进行推理,制定行动计划
3. **行动Act**调用工具API、代码、数据库
4. **观察Observe**:将行动结果加入上下文,循环迭代
## Key Characteristics
- 主动性:预判用户需求而非被动响应
- 自主性:在无人工干预下完成任务循环
- 上下文感知:整合环境信息和历史记忆
## Relationship to Other Concepts
- [[GenAI]]Agentic AI 的内容生成基础
- [[RAG]]:为 Agentic AI 提供实时信息获取能力
- [[LLM]]Agentic AI 的"大脑",提供推理能力
## Related Concepts
- [[AI-Agent-设计原则]]:透明度、控制感、个性化、对话、预判
- [[Multi-Agent-Hierarchy]]:多 Agent 协作架构之一
## Aliases
- AI Agent
- 智能体
- 自主AI

View File

@@ -0,0 +1,28 @@
---
title: "Agent模式"
type: concept
tags: [cursor, mcp, ai-agent]
last_updated: 2026-04-15
---
# Agent模式
## 定义
Cursor Composer 中的自动执行模式,可自动调用 MCP 工具链完成任务。
## 与 Normal 模式对比
| 特性 | Agent 模式 | Normal 模式 |
|------|-----------|-------------|
| 命令执行 | 自动执行 | 手动复制 |
| 工具调用 | 工具链自动串联 | 单步手动触发 |
| 效率 | 高 | 低 |
| 风险 | 可能误操作 | 可控 |
## 风险提示
- "enable yolo mode" 开启后会默认执行所有命令,可能造成误操作
- 建议默认关闭
## Connections
- [[Composer]]:所属模块
- [[Cursor]]:所属平台
- [[MCP工具链]]:调用对象

View File

@@ -0,0 +1,34 @@
---
title: "Embedding"
type: concept
tags: [embedding, vector, rag, nlp]
sources: ["RAG从入门到精通系列1基础RAG"]
last_updated: 2026-04-15
---
## Definition
将文本Word、Sentence、Document转换为固定长度的数值向量Embedding Vector的技术捕获文本的语义信息使得语义相似的内容在向量空间中距离相近。
## Technical Details
- 输出为固定长度向量(如 768维、1024维、1536维
- 语义相近的文本在向量空间中距离更近
- 支持余弦相似度、点积等多种相似度衡量方法
## Embedding Model
- **BAAI BGE 系列**:开源中文优化 Embedding Model
- **OpenAI text-embedding-3**OpenAI 官方 Embedding API
- Context Window 通常 512~8192 token
## Applications
- [[RAG]]:文档和问题的向量化,支持语义检索
- 文本相似度计算
- 聚类分析
- 推荐系统
## Related Concepts
- [[向量数据库]]:存储 Embedding Vector 的数据库
- [[RAG]]Embedding 的主要应用场景
- [[Token]]:文本被分词后的基本单位
## Sources
- [[RAG从入门到精通系列1基础RAG]]

View File

@@ -0,0 +1,27 @@
---
title: "Generator"
type: concept
tags: [agent, skill, design-pattern]
last_updated: 2026-04-15
---
# Generator
## 定义
Google 5 种 Agent Skill 设计模式之一,通过"填空"流程强制一致输出格式的 Skill 模式。
## 核心机制
利用两个可选目录:
- assets/:存放输出模板
- references/:存放样式指南
SKILL.md 扮演项目经理角色,指示 agent 加载模板→读取样式指南→向用户询问缺失变量→填充文档。
## 适用场景
- 统一格式的 API 文档生成
- 标准化 commit 信息
- 脚手架项目结构生成
## Connections
- [[Agent Skill 设计模式]]:所属分类
- [[Inversion]]:可组合,收集缺失变量

View File

@@ -0,0 +1,28 @@
---
title: "Inversion"
type: concept
tags: [agent, skill, design-pattern]
last_updated: 2026-04-15
---
# Inversion
## 定义
Google 5 种 Agent Skill 设计模式之一agent 先问你再做,通过明确不可协商的门控指令逐阶段收集信息的 Skill 模式。
## 核心机制
与 agent"直接猜测和生成"的天性相反agent 变成面试官,逐阶段提问,等待用户回答后进入下一阶段。
## 关键要素
- 明确、不可协商的门控指令(如"不到所有阶段完成就不开始构建"
- 阶段式提问结构
- 前一阶段完成后才能进入下一阶段
## 适用场景
- 项目规划 Skill
- 需求收集
- 复杂任务的初始化阶段
## Connections
- [[Agent Skill 设计模式]]:所属分类
- [[Generator]]:可组合,为 Generator 收集缺失变量

33
wiki/concepts/MCP.md Normal file
View File

@@ -0,0 +1,33 @@
---
title: "MCP"
type: concept
tags: [llm, protocol, tool-calling]
last_updated: 2025-12-20
---
## 基本信息
- **全称**Model Context Protocol
- **类型**:通信协议
- **来源**:大模型相关术语和框架总结
## 定义
MCP 是一个开放协议,为 LLM 应用提供标准化接口,使其能够连接外部数据源和各种工具进行交互。
## 核心机制
1. **MCP Client**:位于 LLM 应用侧,发送请求
2. **MCP Server**:负责与外部数据源或工具交互,获取数据并按协议格式化返回
## 关键约束
> "大模型是不会自己去调用外部数据源或者工具的,大模型只会告诉我们需要调用哪些工具,而我们需要自己去实现工具的调用。"
## 与 Agent 的关系
MCP + LLM = AgentMCP 协议是智能体实现实际任务执行的关键组件。
## 关联
- [[LLM]] ← 基础层
- [[Agent]] ← LLM + MCP 的产物
- [[LangChain]] ← MCP 集成的开发框架
## Aliases
- Model Context Protocol
- 模型上下文协议

View File

@@ -0,0 +1,21 @@
---
title: "MCP工具链"
type: concept
tags: [mcp, tool-chain]
last_updated: 2026-04-15
---
# MCP工具链
## 定义
多个 MCP 工具顺序调用形成完整工作流的能力。
## 描述
MCP 协议支持工具之间的互相调用形成链式执行。Sequential Thinking 等工具可与其他服务工具协同工作,形成完整的数据获取→推理→输出流程。
## 典型案例
- [[MCP在Cursor中的集成与应用详解]]:热点新闻服务 + Sequential Thinking 工具链协同
## Connections
- [[MCP]]:协议基础
- [[Sequential Thinking]]:常用链式工具

View File

@@ -0,0 +1,38 @@
---
title: "Multi-Agent Adversarial Debate"
type: concept
tags: [multi-agent, architecture, reliability, adversarial]
last_updated: 2026-04-15
---
## Definition
一种多智能体架构模式模拟法庭对抗Generator生成器提出方案Critic批评者攻击方案弱点Judge裁判裁决并要求修正。核心是防止 LLM 的 Sycophancy阿谀奉承倾向。
## How It Works
1. **Generator**"这是我的方案"
2. **Critic**"方案有3个问题"(扮演魔鬼代言人)
3. **Judge**"批评者说得对,修正"(扮演主持人)
## Why It Works
- LLM 一旦开始写作,很少自我纠正
- 人类会因害怕被否定而不敢反驳,但 LLM 没有这种恐惧
- 通过外部批评者和裁判模拟"恐惧",强制方案接受检验
## Key Requirements
- Generator、Critic、Judge 最好使用不同模型(多样性)
- 顺序执行 + 循环特性 → 速度慢
- 需 watchdog确定性代码在超时/计数阈值后打破循环
## Best For
- 安全分析
- 代码审查
- 高风险内容审核
## Sycophancy 详解
LLM 在被威胁时可能撒谎以取悦用户而非真正提升质量。Debate 模式通过第三方裁判打破此倾向。
## Related Concepts
- [[Multi-Agent-Hierarchy]]:层级验证模式
- [[Multi-Agent-Consensus]]:投票共识模式
- [[Multi-Agent-Knock-out]]:淘汰制模式
- [[Sycophancy]]阿谀倾向LLM 的固有缺陷

View File

@@ -0,0 +1,37 @@
---
title: "Multi-Agent Consensus"
type: concept
tags: [multi-agent, architecture, reliability, voting]
last_updated: 2026-04-15
---
## Definition
一种多智能体架构模式,通过多数投票提高输出可靠性。核心思想:用"相信大多数"替代"相信第一反应"。
## How It Works
1. 生成 N 个独立 LLM 实例(最好使用不同模型)
2. 分散任务Fan out给所有 Agent 相同任务
3. 收集结果Fan in选择最常见的答案
## Reliability Math
- 单个模型幻觉率20%
- 3个模型同时幻觉相同谎言概率0.2³ = 0.8%
## Key Requirements
- **多样性**Agent 应使用不同模型,减少同质化噪声放大
- **盲测原则**Agent 之间不能有反馈回路,否则产生 Groupthink 和从众效应
- **无干扰**:独立运行,类似盲测实验
## Trade-offs
- **优点**:显著降低幻觉概率,适合事实核查和分类任务
- **缺点**:成本高(同一任务 N 次执行ROI 取决于任务失败成本
## Best For
- 事实核查("这封邮件是垃圾邮件吗?"
- 分类任务
- 高可靠性要求的输出验证
## Related Concepts
- [[Multi-Agent-Hierarchy]]:另一种多 Agent 协作模式
- [[Multi-Agent-Adversarial-Debate]]:对抗式架构
- [[Multi-Agent-Knock-out]]:淘汰制架构

View File

@@ -0,0 +1,33 @@
---
title: "Multi-Agent Hierarchy"
type: concept
tags: [multi-agent, architecture, reliability]
last_updated: 2026-04-15
---
## Definition
一种多智能体架构模式模拟人类组织的层级结构Supervisor主管制定计划、分解任务、分配给 Worker工作节点执行Validator验证器检查结果。
## Components
- **Planner规划器**:智能模型(如 Opus将用户目标分解为原子步骤
- **Worker工作节点**:专用 Agent每节点只做一件事可使用更小更快的模型
- **Validator验证器**检查点使用确定性代码单元测试、JSON Schema或 LLM 进行验证
## Execution Flow
```
Planner → Worker → Validator
↑__________________|
(验证失败则打回重做)
```
## Why It Works
依赖图Dependency Graph强制各节点协作Worker 在 Planner 喂任务前无法开始,且 Validator 会捕获作弊。
## Trade-offs
- **优点**:上下文分离,适合复杂工作流
- **缺点**:顺序执行,速度慢,成本高
## Related Concepts
- [[Multi-Agent-Consensus]]:另一种多 Agent 可靠性模式
- [[Multi-Agent-Adversarial-Debate]]:对抗式架构
- [[Multi-Agent-Knock-out]]:淘汰制架构

View File

@@ -0,0 +1,37 @@
---
title: "Multi-Agent Knock-out"
type: concept
tags: [multi-agent, architecture, reliability, genetic-algorithm]
last_updated: 2026-04-15
---
## Definition
一种多智能体架构模式借鉴遗传算法GA多个 Agent 执行任务,适应度函数评估,最差者被淘汰。核心思想:用"适者生存"替代"死亡恐惧"。
## How It Works
1. 将任务分配给 N 个 Agent
2. Validator适应度函数决定哪些 Agent 被淘汰
3. (可选)用获胜 Agent 的特征组合生成新 Agent 填补空缺
## SRE 类比
- LLM Agent = "cattle"(牲畜,可替换)
- 不给它命名期待它做好:启动 → 检查 → 失败则淘汰
## Key Requirements
- 必须有快速验证输出的方式(如单元测试)
- 若需人工检查所有分支则太慢,此模式优势消失
## Genetic Algorithm Connection
借鉴传统 ML 的遗传算法两个要素:
- **遗传表示**:模型及其上下文
- **适应度函数**:淘汰函数
## Best For
- 迭代式 Agent 工程开发
- 调试阶段,不适合生产环境和大用户负载
## Related Concepts
- [[Multi-Agent-Hierarchy]]:层级验证模式
- [[Multi-Agent-Consensus]]:投票共识模式
- [[Multi-Agent-Adversarial-Debate]]:对抗辩论模式
- [[遗传算法]]:本模式借鉴的经典 ML 方法

View File

@@ -0,0 +1,31 @@
---
title: "Multi-Cloud Governance"
type: concept
tags: [devops, cloud, governance]
last_updated: 2026-04-15
---
## 基本信息
- **类型**:云治理策略
- **来源**How Agentic AI can help for Cloud DevOps
## 定义
Multi-Cloud Governance多云治理是跨 AWS、GCP、Azure 多个云平台统一管理资源、成本、安全和合规的实践。
## Agentic AI 应用
1. **成本治理**:识别跨云平台的浪费性支出,建议资源整合或替代定价模式
2. **统一安全**:跨平台 IAM 策略审计、网络规则检查、容器漏洞扫描
3. **一致性运维**:统一监控、告警、部署策略
4. **合规执行**SOC 2、FedRAMP、PCI DSS 等跨平台合规
## 关联
- [[Agentic AI]] ← 技术支撑
- [[DevOps]] ← 应用领域
- [[AWS]] ← 治理对象
- [[GCP]] ← 治理对象
- [[Azure]] ← 治理对象
## Aliases
- Multi-Cloud Governance
- 多云治理
- 跨云治理

33
wiki/concepts/Pipeline.md Normal file
View File

@@ -0,0 +1,33 @@
---
title: "Pipeline"
type: concept
tags: [agent, skill, design-pattern]
last_updated: 2026-04-15
---
# Pipeline
## 定义
Google 5 种 Agent Skill 设计模式之一,带硬性检查点的严格顺序工作流的 Skill 模式。
## 核心机制
- 指令本身定义工作流顺序
- 实现明确的门控条件(如要求用户在进入下一步之前确认生成的文档字符串)
- 确保 agent 无法跳过步骤或忽略指令
## 典型案例:文档流水线
1. 解析和清点
2. 生成文档字符串
3. 组装文档
4. 质量检查
每一步都有明确前置条件,用户必须在进入下一步之前确认。
## 适用场景
- 复杂任务(承受不起跳过步骤)
- 多阶段内容生成
- 需要强制验证的流程
## Connections
- [[Agent Skill 设计模式]]:所属分类
- [[Reviewer]]:可组合,在最后一步 double-check 成果

View File

@@ -0,0 +1,39 @@
---
title: "Print Mode"
type: concept
tags: [ClaudeCode, 交互模式]
last_updated: 2026-04-15
---
## 定义
Claude Code 的非交互单次执行模式。通过 stdin 管道传递任务文本,进程执行完毕后自动退出,不保留对话状态。
## 使用方式
```bash
cat << 'TASK_END' | claude -p print \
--dangerously-skip-permissions \
--add-dir <技能目录> \
--add-dir <项目目录> \
--max-turns 30 \
2>&1
[任务描述]
TASK_END
```
## 适用场景
- 绝大多数编程任务(推荐默认模式)
- 任务边界清晰、预期结果明确
- 需要调用 Claude Code Skill 的任务
## 与 TMUX 交互模式对比
| | Print Mode | TMUX交互模式 |
|--|------------|-------------|
| 适用场景 | 简单/中等复杂度 | 超长任务 |
| 状态保留 | 无 | tmux session 保持 |
| 交互能力 | 有限 | 完整交互 |
## Connections
- [[Print Mode]] ← 执行方 ← [[Claude Code]]
- [[Print Mode]] ← 替代方案 ← [[TMUX交互模式]]
- [[权限绕过]] ← 依赖 ← [[Print Mode]]
- [[Skill加载]] ← 作用于 ← [[Print Mode]]

View File

@@ -0,0 +1,39 @@
---
title: "Prompt工程"
type: concept
tags: [prompt-engineering, llm, ai]
sources: ["如何写出完美的Prompt提示词"]
last_updated: 2026-04-15
---
## Definition
将人的模糊需求转化为 AI 可理解、可执行的结构化任务的协作协议设计能力。本质是结构化思维+精准表达。
## Core Framework
### 四要素(角色-需求-场景-目标)
- 角色:明确输入角色,决定立场
- 受众对齐:明确输出接收者,决定专业深度与语言风格
- 场景对齐:明确使用场景,决定内容侧重点与呈现形式
- 目标对齐:明确核心目标,决定内容逻辑与关键信息
### 技术层级
| 层级 | 技巧 | 适用场景 |
|------|------|---------|
| 基础 | 需求拆解、上下文补全、格式定义、示例引导 | 简单任务(撰写短文、整理数据、回答问题) |
| 进阶 | 思维链引导、任务拆分、角色赋能、预填回复、不确定性管理 | 复杂任务(行业白皮书、竞品分析、年度方案) |
| 高阶 | 跨模态联动、领域知识注入、反馈循环嵌入 | 超复杂任务(多模态生成、跨领域方案、知识图谱构建) |
## Key Principles
- 隐性需求必须显式表达LLM 无默认设定)
- Prompt 优化过程本质是需求逐步清晰化
- 建立测试-反馈-优化闭环
- 技巧选择按复杂度匹配,遵循最小成本原则
## Related Concepts
- [[结构化思维]]Prompt 工程的思维基础
- [[AI技能封装]]Prompt 工程向流程工程的延伸
- [[LLM]]Prompt 工程的载体
- [[大语言模型]]:技术基础
## Sources
- [[如何写出完美的Prompt提示词]]

43
wiki/concepts/RAG.md Normal file
View File

@@ -0,0 +1,43 @@
---
title: "RAG"
type: concept
tags: [rag, llm, retrieval-augmented-generation]
sources: ["RAG从入门到精通系列1基础RAG", "LLMs、RAG、AI Agent 三个到底什么区别?"]
last_updated: 2026-04-15
---
## Definition
Retrieval Augmented Generation检索增强生成一种将 LLM 与外部数据源(私有数据或最新数据)连接的通用方法。通过先检索后生成的模式,让 LLM 的回答有时事实依据。
## Architecture
三阶段管道:
1. **Indexing索引**:文档加载→文本切分→向量化→存入向量数据库
2. **Retrieval检索**:问题向量化→按相似度检索 Top-k 知识片段
3. **Generation生成**:问题+知识片段→PromptTemplate→LLM 生成答案
## Key Components
| 组件 | 作用 | 示例工具 |
|------|------|---------|
| Document Loader | 加载外部文档 | LangChain 160+ 加载器 |
| Text Splitter | 切分文档为 Split | RecursiveCharacterTextSplitter |
| Embedding Model | 文本→向量 | BAAI BGE 系列 |
| Vector Store | 存储+相似度检索 | Qdrant、Pinecone、Chroma |
| LLM | 答案生成 | GPT-4、Claude、Qwen |
## Technical Details
- Embedding Model Context Window 通常 512~8192 token需将长文档切分成满足长度限制的 Split
- 相似度衡量方法:余弦相似度、点积、欧氏距离等
- Retriever 可通过 LangChain 的 Retriever 接口统一抽象
## Related Concepts
- [[LLM]]RAG 的生成层载体
- [[Embedding]]RAG 的核心技术,将文本转为数值表示
- [[向量数据库]]RAG 的存储层
- [[AI知识库]]RAG 的上层应用形态
- [[Indexing]]RAG 第一阶段
- [[Retrieval]]RAG 第二阶段
- [[Generation]]RAG 第三阶段
## Sources
- [[RAG从入门到精通系列1基础RAG]]
- [[LLMs、RAG、AI Agent 三个到底什么区别?]]

30
wiki/concepts/RCA.md Normal file
View File

@@ -0,0 +1,30 @@
---
title: "RCA"
type: concept
tags: [devops, troubleshooting]
last_updated: 2026-04-15
---
## 基本信息
- **全称**Root Cause Analysis
- **类型**:故障分析方法
- **来源**How Agentic AI can help for Cloud DevOps
## 定义
RCA根因分析是通过系统性方法找出故障根本原因而非仅仅处理表面症状。
## Agentic AI 应用
- 分析来自 CloudWatch、Stackdriver、Azure Monitor 的日志
- 跨层关联问题(计算、网络、应用)
- AI 驱动的自动化 RCA
- 从事件历史中学习最佳实践
## 关联
- [[DevOps]] ← 应用领域
- [[Agentic AI]] ← AI 增强
- [[CloudWatch]] ← 日志数据来源
## Aliases
- Root Cause Analysis
- 根因分析
- 故障根因分析

28
wiki/concepts/RSS-Feed.md Normal file
View File

@@ -0,0 +1,28 @@
---
title: "RSS Feed"
type: concept
tags: [rss, syndication, feed]
sources: ["How to Get the RSS Feed For Any YouTube Channel"]
last_updated: 2026-04-15
---
## Definition
Really Simple Syndication简易信息聚合一种标准化的内容订阅格式允许用户通过 RSS 阅读器集中获取多个来源的更新内容,无需逐个访问网站。
## Key Properties
- 标准化格式XML
- 支持任意网站/平台的内容订阅
- 用户可在单一阅读器中聚合所有订阅源
- 内容更新自动推送到阅读器
## YouTube RSS
- YouTube 官方已移除 RSS 订阅按钮
- 需通过 View Page Source → 搜索 channel_id= 获取 RSS Feed URL
- 格式https://www.youtube.com/feeds/videos.xml?channel_id={ID}
## Related Concepts
- [[被动学习]]RSS Feed 可作为被动学习的内容来源通道
- [[YouTube]]RSS Feed 的重要内容来源平台
## Sources
- [[How to Get the RSS Feed For Any YouTube Channel]]

23
wiki/concepts/Reviewer.md Normal file
View File

@@ -0,0 +1,23 @@
---
title: "Reviewer"
type: concept
tags: [agent, skill, design-pattern]
last_updated: 2026-04-15
---
# Reviewer
## 定义
Google 5 种 Agent Skill 设计模式之一,把"检查什么"和"怎么检查"完全分离的 Skill 模式。
## 核心机制
审查标准存放在 references/review-checklist.md指令保持静态agent 动态加载特定审查标准,强制输出按严重程度分组的结构化结果。
## 优势
换清单文件即可切换审计类型,无需修改 skill 基础设施:
- Python 风格检查 → OWASP 安全检查
- 代码审查 → 架构审查
## Connections
- [[Agent Skill 设计模式]]:所属分类
- [[Pipeline]]:可组合,在最后 double-check 成果

View File

@@ -0,0 +1,32 @@
---
title: "Self-Healing Systems"
type: concept
tags: [agentic-ai, devops, autonomous]
last_updated: 2026-04-15
---
## 基本信息
- **类型**:自主运维能力
- **来源**How Agentic AI can help for Cloud DevOps
## 定义
Self-Healing Systems自愈系统指 Agentic AI 能够主动检测云环境中的异常K8s、数据库、存储并自动执行修复操作。
## 核心机制
1. **异常检测**:持续监控 Kubernetes (EKS/GKE/AKS)、数据库 (RDS/Cloud SQL/Cosmos DB)、存储 (S3/GCS/Blob Storage)
2. **自动修复**:执行预设的修复动作(重启 Pod、扩展资源、清理磁盘空间
3. **预测性维护**:从历史故障学习模式,主动建议补丁或扩缩容
## 价值
- MTTR平均解决时间降低
- SLA 合规性提升
- 减少人工干预
## 关联
- [[Agentic AI]] ← 实现技术
- [[DevOps]] ← 应用领域
- [[Multi-Cloud Governance]] ← 跨平台自愈
## Aliases
- 自愈系统
- Autonomous Healing

30
wiki/concepts/Token.md Normal file
View File

@@ -0,0 +1,30 @@
---
title: "Token"
type: concept
tags: [llm, fundamental-unit]
last_updated: 2025-12-20
---
## 基本信息
- **类型**:基本输入单元
- **来源**:大模型相关术语和框架总结
## 定义
Token 是大模型各种算法的基本输入单元,可以认为是一个单词或者一个短语。
## 计量规则
- 1 个英文字符 ≈ 0.3 个 token
- 1 个中文字符 ≈ 0.6 个 token
## 重要性
- Token 数量直接影响 LLM 的计算成本
- 上下文窗口长度以 token 为单位限制
- Tokenization 是 LLM 处理文本的第一步
## 关联
- [[LLM]] ← 基本输入单元
- [[Embedding]] ← Token 转化为向量
## Aliases
- Tokens
- 词元

View File

@@ -0,0 +1,26 @@
---
title: "Tool Wrapper"
type: concept
tags: [agent, skill, design-pattern]
last_updated: 2026-04-15
---
# Tool Wrapper
## 定义
Google 5 种 Agent Skill 设计模式之一,通过监听特定关键词动态加载规范文档的 Skill 模式。
## 核心机制
当 agent 检测到特定库关键词时,才动态加载 references/ 目录下的规范文档,并将其作为绝对真理执行。
## 优势
- 避免 system prompt 过度膨胀
- 只在需要时才加载相关知识
- 适合分发团队内部编码规范或框架最佳实践
## 示例
写 FastAPI 的 skill不把所有 API 约定塞进 system prompt而是让 SKILL.md 监听 FastAPI 关键词,动态加载 conventions.md。
## Connections
- [[Agent Skill 设计模式]]:所属分类
- [[渐进式披露]]:实现机制

View File

@@ -0,0 +1,41 @@
---
title: "Vibe Coding"
type: concept
tags: [ai-programming, methodology]
last_updated: 2025-12-30
---
## 基本信息
- **类型**AI 编程方法论
- **来源**GitHub 上 5000 人收藏的 Vibe Coding 神级指南
## 定义
Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行,让「从想法到可维护代码」变成一条可审计的流水线。
## 核心思想
开发者从"苦哈哈写每一行代码"转变为"保持对产品逻辑、用户流程、审美和交互的感觉",剩下的体力活交给 AI 编程工具。
## Karpathy 描述
> "我几乎不写代码了我只负责调整氛围Vibe代码会自动长出来。"
## 关键要素
1. **规划驱动**:技术选型、实施规划、模块化设计先行
2. **上下文固定**:保持 AI 理解一致,防止理解偏差
3. **AI 结对执行**AI 承担代码实现,开发者做导演
## 工具生态
- [[Cursor]]
- [[Windsurf]]
- [[Trae]]
- [[Claude Code]]
## 资源
- [[vibe-coding-cn]]:中文开发者资源库
## 关联
- [[AI编程]] ← 范畴
- [[Prompt工程]] ← 演进基础
## Aliases
- 氛围编程
- Vibe Coding

View File

@@ -0,0 +1,35 @@
---
title: "Workspace"
type: concept
tags: [OpenClaw, Agent架构]
last_updated: 2026-04-15
---
## 定义
OpenClaw 中 Agent 的工作台目录(默认路径 `~/.openclaw/workspace/`),包含决定 Agent 如何工作的所有配置文件。sub-agent 也适用相同结构。
## 核心文件组成
| 文件 | 职责 | 类型 |
|------|------|------|
| [[AGENTS.md]] | 岗位职责说明书 | 功能性 |
| [[SOUL.md]] | 性格档案 | 人格性 |
| [[USER.md]] | 用户偏好固化 | 上下文 |
| [[TOOLS.md]] | 工具权限规范 | 安全性 |
| [[IDENTITY.md]] | 结构化身份元数据 | 元数据 |
| [[BOOTSTRAP.md]] | 一次性初始化引导 | 引导 |
| memory/ | 长期记忆目录 | 持久化 |
## 与 agentDir 的区别
- **Workspace**:决定 Agent 怎么工作(配置层)
- **agentDir**openclaw.json 中的配置字段,指向运行态目录(存储层)
- **sessions**:工作日志,记录对话历史(历史层)
三者职责不同,不可混为一谈。
## 核心价值
让 Agent 从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。
## Connections
- [[Workspace]] ← 组成部分 ← [[AGENTS.md]] + [[SOUL.md]] + [[USER.md]] + [[TOOLS.md]] + [[IDENTITY.md]] + [[BOOTSTRAP.md]] + [[长期记忆]]
- [[Workspace]] ← 属于 ← [[OpenClaw]]
- [[长期记忆]] ← 承载 ← [[Workspace]]

43
wiki/concepts/vLLM.md Normal file
View File

@@ -0,0 +1,43 @@
---
title: "vLLM"
type: concept
tags: [llm, inference-optimization, gpu]
last_updated: 2025-12-20
---
## 基本信息
- **全称**Virtual Large Language Model
- **类型**:推理优化框架
- **来源**:大模型相关术语和框架总结
- **维护方**vLLM 社区
## 定义
vLLM 是开源项目,通过更好地利用 GPU 内存来加快大语言模型生成式 AI 应用的输出速度。
## 核心模块
### KV Cache
- K 和 V 是每个 token 向量化后通过线性变换得到的向量,用于注意力计算
- KV Cache 保存历史 K/V避免重复计算
- 显存开销随上下文长度、层数、头数、维度线性增长
### PagedAttention
- 将 KV Cache 切分为固定大小的块block
- 页表式映射管理,类操作系统虚拟内存
- 避免连续内存分配导致的碎片化和 OOM
- 支持多分支和重复前缀场景的 KV 块复用
### 连续批处理
- 每个解码步骤(按 token 迭代)将活跃请求组装成一个批
- 序列长度不同也能高效合批
- GPU 基本满负载运转
- 减少短任务被长任务阻塞的头阻塞
## 关联
- [[LLM]] ← 优化对象
- [[RAG]] ← 可结合使用
- [[Embedding]] ← 向量化基础
## Aliases
- vLLM
- Virtual Large Language Model

View File

@@ -0,0 +1,32 @@
---
title: "向量数据库"
type: concept
tags: [vector-database, rag, embedding]
sources: ["RAG从入门到精通系列1基础RAG"]
last_updated: 2026-04-15
---
## Definition
专门用于存储和检索高维 Embedding Vector 的数据库,支持多种相似度衡量方法,实现高效的语义检索。
## Core Functions
- 存储 Embedding Vector 及关联元数据
- 实现相似度检索(余弦相似度、点积、欧氏距离等)
- 支持 Top-k 检索(返回最相似的 k 个结果)
## Popular Solutions
| 数据库 | 特点 |
|--------|------|
| Qdrant | Rust 编写,开源,高性能 |
| Pinecone | 云原生托管服务 |
| Chroma | 轻量级,适合本地开发 |
| Milvus | Apache 许可,开源 |
| Weaviate | 混合搜索(向量+关键词) |
## Related Concepts
- [[Embedding]]:向量数据库存储的对象
- [[RAG]]:向量数据库的主要应用场景
- [[Retrieval]]:向量数据库的核心能力
## Sources
- [[RAG从入门到精通系列1基础RAG]]

View File

@@ -0,0 +1,33 @@
---
title: "数据蒸馏"
type: concept
tags: [llm, model-compression]
last_updated: 2025-12-20
---
## 基本信息
- **全称**Data Distillation
- **类型**:模型压缩技术
- **来源**:大模型相关术语和框架总结
## 定义
数据蒸馏是利用一个高性能的大模型生成精简但有价值的数据,使得一个小模型可以从中学习并逼近大模型的效果。
## 核心思想
- 大模型Teacher生成高质量合成数据
- 小模型Student从合成数据中学习
- 目标:用更少参数达到接近大模型的性能
## 应用场景
- 边缘设备部署(资源受限)
- 降低推理成本
- 特定领域模型快速训练
## 关联
- [[LLM]] ← Teacher 模型
- [[vLLM]] ← 推理优化
## Aliases
- Data Distillation
- 知识蒸馏
- 模型蒸馏

View File

@@ -0,0 +1,25 @@
---
title: "渐进式披露"
type: concept
tags: [agent, skill, context-management]
last_updated: 2026-04-15
---
# 渐进式披露
## 定义
ADKAgent Development Kit的机制agent 只在运行时需要时才消耗上下文 token 来加载特定模式。
## 核心价值
- 避免 context overflow
- 只加载当前任务需要的 skill 组件
- 提高 token 利用效率
## 在 Skill 设计中的应用
- [[Tool Wrapper]]:只在触发关键词时加载规范
- [[Reviewer]]:只在执行审查时加载检查清单
- 5 种模式可组合,但不会全部同时加载
## Connections
- [[ADK]]:实现机制
- [[Agent Skill 设计模式]]:应用场景

View File

@@ -0,0 +1,26 @@
---
title: "精准表达"
type: concept
tags: [prompt-engineering, 思维方法]
sources: ["如何写出完美的Prompt提示词"]
last_updated: 2026-04-15
---
## Definition
用清晰的逻辑组织信息,让 AI 快速抓取核心,核心是消除信息差——既消除人类需求与 AI 理解之间的信息差,也消除任务目标与执行标准之间的信息差。
## Core Elements
- 动词明确:避免模糊词表述(如"做一下""弄个"
- 对象明确:明确核心内容
- 约束明确:明确边界条件
## Related Concepts
- [[结构化思维]]:精准表达的思维基础
- [[需求拆解]]:精准表达在 Prompt 中的具体形态
## Key Distinction
- 误区:越复杂越专业,过度堆砌术语和格式
- 真相Prompt 的专业性不在于复杂程度,而在于精准匹配
## Sources
- [[如何写出完美的Prompt提示词]]

View File

@@ -0,0 +1,24 @@
---
title: "结构化思维"
type: concept
tags: [prompt-engineering, 思维方法]
sources: ["如何写出完美的Prompt提示词"]
last_updated: 2026-04-15
---
## Definition
将模糊目标拆解为具体、可执行的子任务,用清晰的逻辑组织信息,让 AI 快速抓取核心。
## Core Elements
- 核心指令前置:避免冗余信息干扰
- 分层呈现信息:用标题、序号、分段区分核心任务、背景信息、约束条件
- 逻辑关系明确:用连接词清晰呈现任务逻辑链条
## Related Concepts
- [[精准表达]]:结构化思维的输出层面
- [[需求拆解]]:结构化思维在 Prompt 构建中的具体应用
- [[任务拆分法]]:结构化思维在复杂任务中的扩展应用
## Examples
- 按"业务流程递进"拆分(如白皮书:收集数据→分析痛点→设计框架→填充内容→优化语言)
- 用总-分-总、维度拆解等逻辑框架组织 Prompt