Auto-sync
This commit is contained in:
29
wiki/concepts/AI工作流自动生成.md
Normal file
29
wiki/concepts/AI工作流自动生成.md
Normal file
@@ -0,0 +1,29 @@
|
||||
---
|
||||
title: "AI工作流自动生成"
|
||||
type: concept
|
||||
tags: [ai, workflow-automation, n8n]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# AI工作流自动生成
|
||||
|
||||
## 定义
|
||||
通过自然语言描述需求,由 AI 自动设计并生成工作流代码的过程。
|
||||
|
||||
## 核心机制
|
||||
1. 用户输入自然语言需求描述
|
||||
2. AI 理解任务目标并选择合适节点
|
||||
3. AI 自动生成节点连接和配置代码
|
||||
4. 用户验证并修正错误
|
||||
|
||||
## 典型案例
|
||||
- [[使用Claude自动生成N8N工作流的实操教程]]:Claude + n8n-mcp 实现 80%-90% 完成度
|
||||
|
||||
## 局限性
|
||||
- AI 生成工作流约 10%-20% 错误率需人工修正
|
||||
- 需选择专用模型(如 Opensea)和开启 extended thinking 提升质量
|
||||
|
||||
## Connections
|
||||
- [[n8n]]:目标工作流平台
|
||||
- [[Claude]]:生成执行方
|
||||
- [[n8n-mcp]]:桥接工具
|
||||
56
wiki/concepts/Agent-Skill设计模式.md
Normal file
56
wiki/concepts/Agent-Skill设计模式.md
Normal file
@@ -0,0 +1,56 @@
|
||||
---
|
||||
title: "Agent Skill 设计模式"
|
||||
type: concept
|
||||
tags: [agent, skill, design-pattern]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# Agent Skill 设计模式
|
||||
|
||||
## 定义
|
||||
Google 发布的 5 种 Skill 内容结构化设计模式,用于解决 SKILL.md 格式标准化后执行效果差异大的问题。
|
||||
|
||||
## 5 种模式
|
||||
|
||||
### 1. Tool Wrapper
|
||||
- **用途**:让 agent 快速成为某个领域专家
|
||||
- **机制**:监听特定库关键词,动态加载规范文档
|
||||
- **适用**:团队内部编码规范、特定框架最佳实践
|
||||
|
||||
### 2. Generator
|
||||
- **用途**:从模板生成结构化输出
|
||||
- **机制**:"填空"流程,assets/ 模板 + references/ 样式指南
|
||||
- **适用**:统一 API 文档、标准化 commit 信息、脚手架项目
|
||||
|
||||
### 3. Reviewer
|
||||
- **用途**:把检查清单和检查逻辑分开
|
||||
- **机制**:审查标准存放在 references/review-checklist.md,换清单即换审计类型
|
||||
- **适用**:代码审查、安全审计、合规检查
|
||||
|
||||
### 4. Inversion
|
||||
- **用途**:agent 先问你再做
|
||||
- **机制**:通过不可协商的门控指令逐阶段收集信息
|
||||
- **适用**:项目规划、需求收集
|
||||
|
||||
### 5. Pipeline
|
||||
- **用途**:带硬性检查点的严格工作流
|
||||
- **机制**:明确前置条件和门控条件,强制顺序执行
|
||||
- **适用**:复杂任务、文档流水线、多阶段生成
|
||||
|
||||
## 模式组合
|
||||
- Pipeline 可包含 Reviewer 步骤(double-check 成果)
|
||||
- Generator 可依赖 Inversion 收集缺失变量
|
||||
|
||||
## Anthropic 补充
|
||||
- 最好的 Skill 不是"写好的提示词",而是"工具箱"
|
||||
- Skill = 说明书 + SOP
|
||||
- 写 Skill 三条铁律:只写 Agent 不知道的东西、重点写踩坑清单、给工具不给指令
|
||||
|
||||
## Connections
|
||||
- [[Tool Wrapper]]:模式之一
|
||||
- [[Generator]]:模式之一
|
||||
- [[Reviewer]]:模式之一
|
||||
- [[Inversion]]:模式之一
|
||||
- [[Pipeline]]:模式之一
|
||||
- [[渐进式披露]]:ADK 机制支撑
|
||||
- [[AI技能封装]]:相关领域
|
||||
34
wiki/concepts/Agentic-AI.md
Normal file
34
wiki/concepts/Agentic-AI.md
Normal file
@@ -0,0 +1,34 @@
|
||||
---
|
||||
title: "Agentic AI"
|
||||
type: concept
|
||||
tags: [ai-agent, autonomy]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
能感知环境、做出决策、预判需求并自主采取行动的 AI 系统。与 GenAI(生成内容)的被动响应不同,Agentic AI 强调行动导向,与环境持续交互。
|
||||
|
||||
## Core Loop
|
||||
1. **感知(Perceive)**:获取任务,扫描环境上下文
|
||||
2. **思考(Reason)**:使用 LLM 进行推理,制定行动计划
|
||||
3. **行动(Act)**:调用工具(API、代码、数据库)
|
||||
4. **观察(Observe)**:将行动结果加入上下文,循环迭代
|
||||
|
||||
## Key Characteristics
|
||||
- 主动性:预判用户需求而非被动响应
|
||||
- 自主性:在无人工干预下完成任务循环
|
||||
- 上下文感知:整合环境信息和历史记忆
|
||||
|
||||
## Relationship to Other Concepts
|
||||
- [[GenAI]]:Agentic AI 的内容生成基础
|
||||
- [[RAG]]:为 Agentic AI 提供实时信息获取能力
|
||||
- [[LLM]]:Agentic AI 的"大脑",提供推理能力
|
||||
|
||||
## Related Concepts
|
||||
- [[AI-Agent-设计原则]]:透明度、控制感、个性化、对话、预判
|
||||
- [[Multi-Agent-Hierarchy]]:多 Agent 协作架构之一
|
||||
|
||||
## Aliases
|
||||
- AI Agent
|
||||
- 智能体
|
||||
- 自主AI
|
||||
28
wiki/concepts/Agent模式.md
Normal file
28
wiki/concepts/Agent模式.md
Normal file
@@ -0,0 +1,28 @@
|
||||
---
|
||||
title: "Agent模式"
|
||||
type: concept
|
||||
tags: [cursor, mcp, ai-agent]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# Agent模式
|
||||
|
||||
## 定义
|
||||
Cursor Composer 中的自动执行模式,可自动调用 MCP 工具链完成任务。
|
||||
|
||||
## 与 Normal 模式对比
|
||||
| 特性 | Agent 模式 | Normal 模式 |
|
||||
|------|-----------|-------------|
|
||||
| 命令执行 | 自动执行 | 手动复制 |
|
||||
| 工具调用 | 工具链自动串联 | 单步手动触发 |
|
||||
| 效率 | 高 | 低 |
|
||||
| 风险 | 可能误操作 | 可控 |
|
||||
|
||||
## 风险提示
|
||||
- "enable yolo mode" 开启后会默认执行所有命令,可能造成误操作
|
||||
- 建议默认关闭
|
||||
|
||||
## Connections
|
||||
- [[Composer]]:所属模块
|
||||
- [[Cursor]]:所属平台
|
||||
- [[MCP工具链]]:调用对象
|
||||
34
wiki/concepts/Embedding.md
Normal file
34
wiki/concepts/Embedding.md
Normal file
@@ -0,0 +1,34 @@
|
||||
---
|
||||
title: "Embedding"
|
||||
type: concept
|
||||
tags: [embedding, vector, rag, nlp]
|
||||
sources: ["RAG从入门到精通系列1:基础RAG"]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
将文本(Word、Sentence、Document)转换为固定长度的数值向量(Embedding Vector)的技术,捕获文本的语义信息使得语义相似的内容在向量空间中距离相近。
|
||||
|
||||
## Technical Details
|
||||
- 输出为固定长度向量(如 768维、1024维、1536维)
|
||||
- 语义相近的文本在向量空间中距离更近
|
||||
- 支持余弦相似度、点积等多种相似度衡量方法
|
||||
|
||||
## Embedding Model
|
||||
- **BAAI BGE 系列**:开源中文优化 Embedding Model
|
||||
- **OpenAI text-embedding-3**:OpenAI 官方 Embedding API
|
||||
- Context Window 通常 512~8192 token
|
||||
|
||||
## Applications
|
||||
- [[RAG]]:文档和问题的向量化,支持语义检索
|
||||
- 文本相似度计算
|
||||
- 聚类分析
|
||||
- 推荐系统
|
||||
|
||||
## Related Concepts
|
||||
- [[向量数据库]]:存储 Embedding Vector 的数据库
|
||||
- [[RAG]]:Embedding 的主要应用场景
|
||||
- [[Token]]:文本被分词后的基本单位
|
||||
|
||||
## Sources
|
||||
- [[RAG从入门到精通系列1:基础RAG]]
|
||||
27
wiki/concepts/Generator.md
Normal file
27
wiki/concepts/Generator.md
Normal file
@@ -0,0 +1,27 @@
|
||||
---
|
||||
title: "Generator"
|
||||
type: concept
|
||||
tags: [agent, skill, design-pattern]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# Generator
|
||||
|
||||
## 定义
|
||||
Google 5 种 Agent Skill 设计模式之一,通过"填空"流程强制一致输出格式的 Skill 模式。
|
||||
|
||||
## 核心机制
|
||||
利用两个可选目录:
|
||||
- assets/:存放输出模板
|
||||
- references/:存放样式指南
|
||||
|
||||
SKILL.md 扮演项目经理角色,指示 agent 加载模板→读取样式指南→向用户询问缺失变量→填充文档。
|
||||
|
||||
## 适用场景
|
||||
- 统一格式的 API 文档生成
|
||||
- 标准化 commit 信息
|
||||
- 脚手架项目结构生成
|
||||
|
||||
## Connections
|
||||
- [[Agent Skill 设计模式]]:所属分类
|
||||
- [[Inversion]]:可组合,收集缺失变量
|
||||
28
wiki/concepts/Inversion.md
Normal file
28
wiki/concepts/Inversion.md
Normal file
@@ -0,0 +1,28 @@
|
||||
---
|
||||
title: "Inversion"
|
||||
type: concept
|
||||
tags: [agent, skill, design-pattern]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# Inversion
|
||||
|
||||
## 定义
|
||||
Google 5 种 Agent Skill 设计模式之一,agent 先问你再做,通过明确不可协商的门控指令逐阶段收集信息的 Skill 模式。
|
||||
|
||||
## 核心机制
|
||||
与 agent"直接猜测和生成"的天性相反,agent 变成面试官,逐阶段提问,等待用户回答后进入下一阶段。
|
||||
|
||||
## 关键要素
|
||||
- 明确、不可协商的门控指令(如"不到所有阶段完成就不开始构建")
|
||||
- 阶段式提问结构
|
||||
- 前一阶段完成后才能进入下一阶段
|
||||
|
||||
## 适用场景
|
||||
- 项目规划 Skill
|
||||
- 需求收集
|
||||
- 复杂任务的初始化阶段
|
||||
|
||||
## Connections
|
||||
- [[Agent Skill 设计模式]]:所属分类
|
||||
- [[Generator]]:可组合,为 Generator 收集缺失变量
|
||||
33
wiki/concepts/MCP.md
Normal file
33
wiki/concepts/MCP.md
Normal file
@@ -0,0 +1,33 @@
|
||||
---
|
||||
title: "MCP"
|
||||
type: concept
|
||||
tags: [llm, protocol, tool-calling]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
- **全称**:Model Context Protocol
|
||||
- **类型**:通信协议
|
||||
- **来源**:大模型相关术语和框架总结
|
||||
|
||||
## 定义
|
||||
MCP 是一个开放协议,为 LLM 应用提供标准化接口,使其能够连接外部数据源和各种工具进行交互。
|
||||
|
||||
## 核心机制
|
||||
1. **MCP Client**:位于 LLM 应用侧,发送请求
|
||||
2. **MCP Server**:负责与外部数据源或工具交互,获取数据并按协议格式化返回
|
||||
|
||||
## 关键约束
|
||||
> "大模型是不会自己去调用外部数据源或者工具的,大模型只会告诉我们需要调用哪些工具,而我们需要自己去实现工具的调用。"
|
||||
|
||||
## 与 Agent 的关系
|
||||
MCP + LLM = Agent,MCP 协议是智能体实现实际任务执行的关键组件。
|
||||
|
||||
## 关联
|
||||
- [[LLM]] ← 基础层
|
||||
- [[Agent]] ← LLM + MCP 的产物
|
||||
- [[LangChain]] ← MCP 集成的开发框架
|
||||
|
||||
## Aliases
|
||||
- Model Context Protocol
|
||||
- 模型上下文协议
|
||||
21
wiki/concepts/MCP工具链.md
Normal file
21
wiki/concepts/MCP工具链.md
Normal file
@@ -0,0 +1,21 @@
|
||||
---
|
||||
title: "MCP工具链"
|
||||
type: concept
|
||||
tags: [mcp, tool-chain]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# MCP工具链
|
||||
|
||||
## 定义
|
||||
多个 MCP 工具顺序调用形成完整工作流的能力。
|
||||
|
||||
## 描述
|
||||
MCP 协议支持工具之间的互相调用,形成链式执行。Sequential Thinking 等工具可与其他服务工具协同工作,形成完整的数据获取→推理→输出流程。
|
||||
|
||||
## 典型案例
|
||||
- [[MCP在Cursor中的集成与应用详解]]:热点新闻服务 + Sequential Thinking 工具链协同
|
||||
|
||||
## Connections
|
||||
- [[MCP]]:协议基础
|
||||
- [[Sequential Thinking]]:常用链式工具
|
||||
38
wiki/concepts/Multi-Agent-Adversarial-Debate.md
Normal file
38
wiki/concepts/Multi-Agent-Adversarial-Debate.md
Normal file
@@ -0,0 +1,38 @@
|
||||
---
|
||||
title: "Multi-Agent Adversarial Debate"
|
||||
type: concept
|
||||
tags: [multi-agent, architecture, reliability, adversarial]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
一种多智能体架构模式,模拟法庭对抗:Generator(生成器)提出方案,Critic(批评者)攻击方案弱点,Judge(裁判)裁决并要求修正。核心是防止 LLM 的 Sycophancy(阿谀奉承)倾向。
|
||||
|
||||
## How It Works
|
||||
1. **Generator**:"这是我的方案"
|
||||
2. **Critic**:"方案有3个问题"(扮演魔鬼代言人)
|
||||
3. **Judge**:"批评者说得对,修正"(扮演主持人)
|
||||
|
||||
## Why It Works
|
||||
- LLM 一旦开始写作,很少自我纠正
|
||||
- 人类会因害怕被否定而不敢反驳,但 LLM 没有这种恐惧
|
||||
- 通过外部批评者和裁判模拟"恐惧",强制方案接受检验
|
||||
|
||||
## Key Requirements
|
||||
- Generator、Critic、Judge 最好使用不同模型(多样性)
|
||||
- 顺序执行 + 循环特性 → 速度慢
|
||||
- 需 watchdog(确定性代码)在超时/计数阈值后打破循环
|
||||
|
||||
## Best For
|
||||
- 安全分析
|
||||
- 代码审查
|
||||
- 高风险内容审核
|
||||
|
||||
## Sycophancy 详解
|
||||
LLM 在被威胁时可能撒谎以取悦用户,而非真正提升质量。Debate 模式通过第三方裁判打破此倾向。
|
||||
|
||||
## Related Concepts
|
||||
- [[Multi-Agent-Hierarchy]]:层级验证模式
|
||||
- [[Multi-Agent-Consensus]]:投票共识模式
|
||||
- [[Multi-Agent-Knock-out]]:淘汰制模式
|
||||
- [[Sycophancy]]:阿谀倾向,LLM 的固有缺陷
|
||||
37
wiki/concepts/Multi-Agent-Consensus.md
Normal file
37
wiki/concepts/Multi-Agent-Consensus.md
Normal file
@@ -0,0 +1,37 @@
|
||||
---
|
||||
title: "Multi-Agent Consensus"
|
||||
type: concept
|
||||
tags: [multi-agent, architecture, reliability, voting]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
一种多智能体架构模式,通过多数投票提高输出可靠性。核心思想:用"相信大多数"替代"相信第一反应"。
|
||||
|
||||
## How It Works
|
||||
1. 生成 N 个独立 LLM 实例(最好使用不同模型)
|
||||
2. 分散任务(Fan out):给所有 Agent 相同任务
|
||||
3. 收集结果(Fan in):选择最常见的答案
|
||||
|
||||
## Reliability Math
|
||||
- 单个模型幻觉率:20%
|
||||
- 3个模型同时幻觉相同谎言概率:0.2³ = 0.8%
|
||||
|
||||
## Key Requirements
|
||||
- **多样性**:Agent 应使用不同模型,减少同质化噪声放大
|
||||
- **盲测原则**:Agent 之间不能有反馈回路,否则产生 Groupthink 和从众效应
|
||||
- **无干扰**:独立运行,类似盲测实验
|
||||
|
||||
## Trade-offs
|
||||
- **优点**:显著降低幻觉概率,适合事实核查和分类任务
|
||||
- **缺点**:成本高(同一任务 N 次执行),ROI 取决于任务失败成本
|
||||
|
||||
## Best For
|
||||
- 事实核查("这封邮件是垃圾邮件吗?")
|
||||
- 分类任务
|
||||
- 高可靠性要求的输出验证
|
||||
|
||||
## Related Concepts
|
||||
- [[Multi-Agent-Hierarchy]]:另一种多 Agent 协作模式
|
||||
- [[Multi-Agent-Adversarial-Debate]]:对抗式架构
|
||||
- [[Multi-Agent-Knock-out]]:淘汰制架构
|
||||
33
wiki/concepts/Multi-Agent-Hierarchy.md
Normal file
33
wiki/concepts/Multi-Agent-Hierarchy.md
Normal file
@@ -0,0 +1,33 @@
|
||||
---
|
||||
title: "Multi-Agent Hierarchy"
|
||||
type: concept
|
||||
tags: [multi-agent, architecture, reliability]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
一种多智能体架构模式,模拟人类组织的层级结构:Supervisor(主管)制定计划、分解任务、分配给 Worker(工作节点)执行,Validator(验证器)检查结果。
|
||||
|
||||
## Components
|
||||
- **Planner(规划器)**:智能模型(如 Opus)将用户目标分解为原子步骤
|
||||
- **Worker(工作节点)**:专用 Agent,每节点只做一件事,可使用更小更快的模型
|
||||
- **Validator(验证器)**:检查点,使用确定性代码(单元测试、JSON Schema)或 LLM 进行验证
|
||||
|
||||
## Execution Flow
|
||||
```
|
||||
Planner → Worker → Validator
|
||||
↑__________________|
|
||||
(验证失败则打回重做)
|
||||
```
|
||||
|
||||
## Why It Works
|
||||
依赖图(Dependency Graph)强制各节点协作:Worker 在 Planner 喂任务前无法开始,且 Validator 会捕获作弊。
|
||||
|
||||
## Trade-offs
|
||||
- **优点**:上下文分离,适合复杂工作流
|
||||
- **缺点**:顺序执行,速度慢,成本高
|
||||
|
||||
## Related Concepts
|
||||
- [[Multi-Agent-Consensus]]:另一种多 Agent 可靠性模式
|
||||
- [[Multi-Agent-Adversarial-Debate]]:对抗式架构
|
||||
- [[Multi-Agent-Knock-out]]:淘汰制架构
|
||||
37
wiki/concepts/Multi-Agent-Knock-out.md
Normal file
37
wiki/concepts/Multi-Agent-Knock-out.md
Normal file
@@ -0,0 +1,37 @@
|
||||
---
|
||||
title: "Multi-Agent Knock-out"
|
||||
type: concept
|
||||
tags: [multi-agent, architecture, reliability, genetic-algorithm]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
一种多智能体架构模式,借鉴遗传算法(GA):多个 Agent 执行任务,适应度函数评估,最差者被淘汰。核心思想:用"适者生存"替代"死亡恐惧"。
|
||||
|
||||
## How It Works
|
||||
1. 将任务分配给 N 个 Agent
|
||||
2. Validator(适应度函数)决定哪些 Agent 被淘汰
|
||||
3. (可选)用获胜 Agent 的特征组合生成新 Agent 填补空缺
|
||||
|
||||
## SRE 类比
|
||||
- LLM Agent = "cattle"(牲畜,可替换)
|
||||
- 不给它命名期待它做好:启动 → 检查 → 失败则淘汰
|
||||
|
||||
## Key Requirements
|
||||
- 必须有快速验证输出的方式(如单元测试)
|
||||
- 若需人工检查所有分支则太慢,此模式优势消失
|
||||
|
||||
## Genetic Algorithm Connection
|
||||
借鉴传统 ML 的遗传算法两个要素:
|
||||
- **遗传表示**:模型及其上下文
|
||||
- **适应度函数**:淘汰函数
|
||||
|
||||
## Best For
|
||||
- 迭代式 Agent 工程开发
|
||||
- 调试阶段,不适合生产环境和大用户负载
|
||||
|
||||
## Related Concepts
|
||||
- [[Multi-Agent-Hierarchy]]:层级验证模式
|
||||
- [[Multi-Agent-Consensus]]:投票共识模式
|
||||
- [[Multi-Agent-Adversarial-Debate]]:对抗辩论模式
|
||||
- [[遗传算法]]:本模式借鉴的经典 ML 方法
|
||||
31
wiki/concepts/Multi-Cloud-Governance.md
Normal file
31
wiki/concepts/Multi-Cloud-Governance.md
Normal file
@@ -0,0 +1,31 @@
|
||||
---
|
||||
title: "Multi-Cloud Governance"
|
||||
type: concept
|
||||
tags: [devops, cloud, governance]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
- **类型**:云治理策略
|
||||
- **来源**:How Agentic AI can help for Cloud DevOps
|
||||
|
||||
## 定义
|
||||
Multi-Cloud Governance(多云治理)是跨 AWS、GCP、Azure 多个云平台统一管理资源、成本、安全和合规的实践。
|
||||
|
||||
## Agentic AI 应用
|
||||
1. **成本治理**:识别跨云平台的浪费性支出,建议资源整合或替代定价模式
|
||||
2. **统一安全**:跨平台 IAM 策略审计、网络规则检查、容器漏洞扫描
|
||||
3. **一致性运维**:统一监控、告警、部署策略
|
||||
4. **合规执行**:SOC 2、FedRAMP、PCI DSS 等跨平台合规
|
||||
|
||||
## 关联
|
||||
- [[Agentic AI]] ← 技术支撑
|
||||
- [[DevOps]] ← 应用领域
|
||||
- [[AWS]] ← 治理对象
|
||||
- [[GCP]] ← 治理对象
|
||||
- [[Azure]] ← 治理对象
|
||||
|
||||
## Aliases
|
||||
- Multi-Cloud Governance
|
||||
- 多云治理
|
||||
- 跨云治理
|
||||
33
wiki/concepts/Pipeline.md
Normal file
33
wiki/concepts/Pipeline.md
Normal file
@@ -0,0 +1,33 @@
|
||||
---
|
||||
title: "Pipeline"
|
||||
type: concept
|
||||
tags: [agent, skill, design-pattern]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# Pipeline
|
||||
|
||||
## 定义
|
||||
Google 5 种 Agent Skill 设计模式之一,带硬性检查点的严格顺序工作流的 Skill 模式。
|
||||
|
||||
## 核心机制
|
||||
- 指令本身定义工作流顺序
|
||||
- 实现明确的门控条件(如要求用户在进入下一步之前确认生成的文档字符串)
|
||||
- 确保 agent 无法跳过步骤或忽略指令
|
||||
|
||||
## 典型案例:文档流水线
|
||||
1. 解析和清点
|
||||
2. 生成文档字符串
|
||||
3. 组装文档
|
||||
4. 质量检查
|
||||
|
||||
每一步都有明确前置条件,用户必须在进入下一步之前确认。
|
||||
|
||||
## 适用场景
|
||||
- 复杂任务(承受不起跳过步骤)
|
||||
- 多阶段内容生成
|
||||
- 需要强制验证的流程
|
||||
|
||||
## Connections
|
||||
- [[Agent Skill 设计模式]]:所属分类
|
||||
- [[Reviewer]]:可组合,在最后一步 double-check 成果
|
||||
39
wiki/concepts/Print-Mode.md
Normal file
39
wiki/concepts/Print-Mode.md
Normal file
@@ -0,0 +1,39 @@
|
||||
---
|
||||
title: "Print Mode"
|
||||
type: concept
|
||||
tags: [ClaudeCode, 交互模式]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## 定义
|
||||
Claude Code 的非交互单次执行模式。通过 stdin 管道传递任务文本,进程执行完毕后自动退出,不保留对话状态。
|
||||
|
||||
## 使用方式
|
||||
```bash
|
||||
cat << 'TASK_END' | claude -p print \
|
||||
--dangerously-skip-permissions \
|
||||
--add-dir <技能目录> \
|
||||
--add-dir <项目目录> \
|
||||
--max-turns 30 \
|
||||
2>&1
|
||||
[任务描述]
|
||||
TASK_END
|
||||
```
|
||||
|
||||
## 适用场景
|
||||
- 绝大多数编程任务(推荐默认模式)
|
||||
- 任务边界清晰、预期结果明确
|
||||
- 需要调用 Claude Code Skill 的任务
|
||||
|
||||
## 与 TMUX 交互模式对比
|
||||
| | Print Mode | TMUX交互模式 |
|
||||
|--|------------|-------------|
|
||||
| 适用场景 | 简单/中等复杂度 | 超长任务 |
|
||||
| 状态保留 | 无 | tmux session 保持 |
|
||||
| 交互能力 | 有限 | 完整交互 |
|
||||
|
||||
## Connections
|
||||
- [[Print Mode]] ← 执行方 ← [[Claude Code]]
|
||||
- [[Print Mode]] ← 替代方案 ← [[TMUX交互模式]]
|
||||
- [[权限绕过]] ← 依赖 ← [[Print Mode]]
|
||||
- [[Skill加载]] ← 作用于 ← [[Print Mode]]
|
||||
39
wiki/concepts/Prompt工程.md
Normal file
39
wiki/concepts/Prompt工程.md
Normal file
@@ -0,0 +1,39 @@
|
||||
---
|
||||
title: "Prompt工程"
|
||||
type: concept
|
||||
tags: [prompt-engineering, llm, ai]
|
||||
sources: ["如何写出完美的Prompt(提示词)?"]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
将人的模糊需求转化为 AI 可理解、可执行的结构化任务的协作协议设计能力。本质是结构化思维+精准表达。
|
||||
|
||||
## Core Framework
|
||||
### 四要素(角色-需求-场景-目标)
|
||||
- 角色:明确输入角色,决定立场
|
||||
- 受众对齐:明确输出接收者,决定专业深度与语言风格
|
||||
- 场景对齐:明确使用场景,决定内容侧重点与呈现形式
|
||||
- 目标对齐:明确核心目标,决定内容逻辑与关键信息
|
||||
|
||||
### 技术层级
|
||||
| 层级 | 技巧 | 适用场景 |
|
||||
|------|------|---------|
|
||||
| 基础 | 需求拆解、上下文补全、格式定义、示例引导 | 简单任务(撰写短文、整理数据、回答问题) |
|
||||
| 进阶 | 思维链引导、任务拆分、角色赋能、预填回复、不确定性管理 | 复杂任务(行业白皮书、竞品分析、年度方案) |
|
||||
| 高阶 | 跨模态联动、领域知识注入、反馈循环嵌入 | 超复杂任务(多模态生成、跨领域方案、知识图谱构建) |
|
||||
|
||||
## Key Principles
|
||||
- 隐性需求必须显式表达(LLM 无默认设定)
|
||||
- Prompt 优化过程本质是需求逐步清晰化
|
||||
- 建立测试-反馈-优化闭环
|
||||
- 技巧选择按复杂度匹配,遵循最小成本原则
|
||||
|
||||
## Related Concepts
|
||||
- [[结构化思维]]:Prompt 工程的思维基础
|
||||
- [[AI技能封装]]:Prompt 工程向流程工程的延伸
|
||||
- [[LLM]]:Prompt 工程的载体
|
||||
- [[大语言模型]]:技术基础
|
||||
|
||||
## Sources
|
||||
- [[如何写出完美的Prompt(提示词)?]]
|
||||
43
wiki/concepts/RAG.md
Normal file
43
wiki/concepts/RAG.md
Normal file
@@ -0,0 +1,43 @@
|
||||
---
|
||||
title: "RAG"
|
||||
type: concept
|
||||
tags: [rag, llm, retrieval-augmented-generation]
|
||||
sources: ["RAG从入门到精通系列1:基础RAG", "LLMs、RAG、AI Agent 三个到底什么区别?"]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
Retrieval Augmented Generation(检索增强生成),一种将 LLM 与外部数据源(私有数据或最新数据)连接的通用方法。通过先检索后生成的模式,让 LLM 的回答有时事实依据。
|
||||
|
||||
## Architecture
|
||||
三阶段管道:
|
||||
1. **Indexing(索引)**:文档加载→文本切分→向量化→存入向量数据库
|
||||
2. **Retrieval(检索)**:问题向量化→按相似度检索 Top-k 知识片段
|
||||
3. **Generation(生成)**:问题+知识片段→PromptTemplate→LLM 生成答案
|
||||
|
||||
## Key Components
|
||||
| 组件 | 作用 | 示例工具 |
|
||||
|------|------|---------|
|
||||
| Document Loader | 加载外部文档 | LangChain 160+ 加载器 |
|
||||
| Text Splitter | 切分文档为 Split | RecursiveCharacterTextSplitter |
|
||||
| Embedding Model | 文本→向量 | BAAI BGE 系列 |
|
||||
| Vector Store | 存储+相似度检索 | Qdrant、Pinecone、Chroma |
|
||||
| LLM | 答案生成 | GPT-4、Claude、Qwen |
|
||||
|
||||
## Technical Details
|
||||
- Embedding Model Context Window 通常 512~8192 token,需将长文档切分成满足长度限制的 Split
|
||||
- 相似度衡量方法:余弦相似度、点积、欧氏距离等
|
||||
- Retriever 可通过 LangChain 的 Retriever 接口统一抽象
|
||||
|
||||
## Related Concepts
|
||||
- [[LLM]]:RAG 的生成层载体
|
||||
- [[Embedding]]:RAG 的核心技术,将文本转为数值表示
|
||||
- [[向量数据库]]:RAG 的存储层
|
||||
- [[AI知识库]]:RAG 的上层应用形态
|
||||
- [[Indexing]]:RAG 第一阶段
|
||||
- [[Retrieval]]:RAG 第二阶段
|
||||
- [[Generation]]:RAG 第三阶段
|
||||
|
||||
## Sources
|
||||
- [[RAG从入门到精通系列1:基础RAG]]
|
||||
- [[LLMs、RAG、AI Agent 三个到底什么区别?]]
|
||||
30
wiki/concepts/RCA.md
Normal file
30
wiki/concepts/RCA.md
Normal file
@@ -0,0 +1,30 @@
|
||||
---
|
||||
title: "RCA"
|
||||
type: concept
|
||||
tags: [devops, troubleshooting]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
- **全称**:Root Cause Analysis
|
||||
- **类型**:故障分析方法
|
||||
- **来源**:How Agentic AI can help for Cloud DevOps
|
||||
|
||||
## 定义
|
||||
RCA(根因分析)是通过系统性方法找出故障根本原因,而非仅仅处理表面症状。
|
||||
|
||||
## Agentic AI 应用
|
||||
- 分析来自 CloudWatch、Stackdriver、Azure Monitor 的日志
|
||||
- 跨层关联问题(计算、网络、应用)
|
||||
- AI 驱动的自动化 RCA
|
||||
- 从事件历史中学习最佳实践
|
||||
|
||||
## 关联
|
||||
- [[DevOps]] ← 应用领域
|
||||
- [[Agentic AI]] ← AI 增强
|
||||
- [[CloudWatch]] ← 日志数据来源
|
||||
|
||||
## Aliases
|
||||
- Root Cause Analysis
|
||||
- 根因分析
|
||||
- 故障根因分析
|
||||
28
wiki/concepts/RSS-Feed.md
Normal file
28
wiki/concepts/RSS-Feed.md
Normal file
@@ -0,0 +1,28 @@
|
||||
---
|
||||
title: "RSS Feed"
|
||||
type: concept
|
||||
tags: [rss, syndication, feed]
|
||||
sources: ["How to Get the RSS Feed For Any YouTube Channel"]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
Really Simple Syndication(简易信息聚合),一种标准化的内容订阅格式,允许用户通过 RSS 阅读器集中获取多个来源的更新内容,无需逐个访问网站。
|
||||
|
||||
## Key Properties
|
||||
- 标准化格式(XML)
|
||||
- 支持任意网站/平台的内容订阅
|
||||
- 用户可在单一阅读器中聚合所有订阅源
|
||||
- 内容更新自动推送到阅读器
|
||||
|
||||
## YouTube RSS
|
||||
- YouTube 官方已移除 RSS 订阅按钮
|
||||
- 需通过 View Page Source → 搜索 channel_id= 获取 RSS Feed URL
|
||||
- 格式:https://www.youtube.com/feeds/videos.xml?channel_id={ID}
|
||||
|
||||
## Related Concepts
|
||||
- [[被动学习]]:RSS Feed 可作为被动学习的内容来源通道
|
||||
- [[YouTube]]:RSS Feed 的重要内容来源平台
|
||||
|
||||
## Sources
|
||||
- [[How to Get the RSS Feed For Any YouTube Channel]]
|
||||
23
wiki/concepts/Reviewer.md
Normal file
23
wiki/concepts/Reviewer.md
Normal file
@@ -0,0 +1,23 @@
|
||||
---
|
||||
title: "Reviewer"
|
||||
type: concept
|
||||
tags: [agent, skill, design-pattern]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# Reviewer
|
||||
|
||||
## 定义
|
||||
Google 5 种 Agent Skill 设计模式之一,把"检查什么"和"怎么检查"完全分离的 Skill 模式。
|
||||
|
||||
## 核心机制
|
||||
审查标准存放在 references/review-checklist.md,指令保持静态,agent 动态加载特定审查标准,强制输出按严重程度分组的结构化结果。
|
||||
|
||||
## 优势
|
||||
换清单文件即可切换审计类型,无需修改 skill 基础设施:
|
||||
- Python 风格检查 → OWASP 安全检查
|
||||
- 代码审查 → 架构审查
|
||||
|
||||
## Connections
|
||||
- [[Agent Skill 设计模式]]:所属分类
|
||||
- [[Pipeline]]:可组合,在最后 double-check 成果
|
||||
32
wiki/concepts/Self-Healing-Systems.md
Normal file
32
wiki/concepts/Self-Healing-Systems.md
Normal file
@@ -0,0 +1,32 @@
|
||||
---
|
||||
title: "Self-Healing Systems"
|
||||
type: concept
|
||||
tags: [agentic-ai, devops, autonomous]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
- **类型**:自主运维能力
|
||||
- **来源**:How Agentic AI can help for Cloud DevOps
|
||||
|
||||
## 定义
|
||||
Self-Healing Systems(自愈系统)指 Agentic AI 能够主动检测云环境中的异常(K8s、数据库、存储),并自动执行修复操作。
|
||||
|
||||
## 核心机制
|
||||
1. **异常检测**:持续监控 Kubernetes (EKS/GKE/AKS)、数据库 (RDS/Cloud SQL/Cosmos DB)、存储 (S3/GCS/Blob Storage)
|
||||
2. **自动修复**:执行预设的修复动作(重启 Pod、扩展资源、清理磁盘空间)
|
||||
3. **预测性维护**:从历史故障学习模式,主动建议补丁或扩缩容
|
||||
|
||||
## 价值
|
||||
- MTTR(平均解决时间)降低
|
||||
- SLA 合规性提升
|
||||
- 减少人工干预
|
||||
|
||||
## 关联
|
||||
- [[Agentic AI]] ← 实现技术
|
||||
- [[DevOps]] ← 应用领域
|
||||
- [[Multi-Cloud Governance]] ← 跨平台自愈
|
||||
|
||||
## Aliases
|
||||
- 自愈系统
|
||||
- Autonomous Healing
|
||||
30
wiki/concepts/Token.md
Normal file
30
wiki/concepts/Token.md
Normal file
@@ -0,0 +1,30 @@
|
||||
---
|
||||
title: "Token"
|
||||
type: concept
|
||||
tags: [llm, fundamental-unit]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
- **类型**:基本输入单元
|
||||
- **来源**:大模型相关术语和框架总结
|
||||
|
||||
## 定义
|
||||
Token 是大模型各种算法的基本输入单元,可以认为是一个单词或者一个短语。
|
||||
|
||||
## 计量规则
|
||||
- 1 个英文字符 ≈ 0.3 个 token
|
||||
- 1 个中文字符 ≈ 0.6 个 token
|
||||
|
||||
## 重要性
|
||||
- Token 数量直接影响 LLM 的计算成本
|
||||
- 上下文窗口长度以 token 为单位限制
|
||||
- Tokenization 是 LLM 处理文本的第一步
|
||||
|
||||
## 关联
|
||||
- [[LLM]] ← 基本输入单元
|
||||
- [[Embedding]] ← Token 转化为向量
|
||||
|
||||
## Aliases
|
||||
- Tokens
|
||||
- 词元
|
||||
26
wiki/concepts/Tool-Wrapper.md
Normal file
26
wiki/concepts/Tool-Wrapper.md
Normal file
@@ -0,0 +1,26 @@
|
||||
---
|
||||
title: "Tool Wrapper"
|
||||
type: concept
|
||||
tags: [agent, skill, design-pattern]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# Tool Wrapper
|
||||
|
||||
## 定义
|
||||
Google 5 种 Agent Skill 设计模式之一,通过监听特定关键词动态加载规范文档的 Skill 模式。
|
||||
|
||||
## 核心机制
|
||||
当 agent 检测到特定库关键词时,才动态加载 references/ 目录下的规范文档,并将其作为绝对真理执行。
|
||||
|
||||
## 优势
|
||||
- 避免 system prompt 过度膨胀
|
||||
- 只在需要时才加载相关知识
|
||||
- 适合分发团队内部编码规范或框架最佳实践
|
||||
|
||||
## 示例
|
||||
写 FastAPI 的 skill,不把所有 API 约定塞进 system prompt,而是让 SKILL.md 监听 FastAPI 关键词,动态加载 conventions.md。
|
||||
|
||||
## Connections
|
||||
- [[Agent Skill 设计模式]]:所属分类
|
||||
- [[渐进式披露]]:实现机制
|
||||
41
wiki/concepts/Vibe-Coding.md
Normal file
41
wiki/concepts/Vibe-Coding.md
Normal file
@@ -0,0 +1,41 @@
|
||||
---
|
||||
title: "Vibe Coding"
|
||||
type: concept
|
||||
tags: [ai-programming, methodology]
|
||||
last_updated: 2025-12-30
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
- **类型**:AI 编程方法论
|
||||
- **来源**:GitHub 上 5000 人收藏的 Vibe Coding 神级指南
|
||||
|
||||
## 定义
|
||||
Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行,让「从想法到可维护代码」变成一条可审计的流水线。
|
||||
|
||||
## 核心思想
|
||||
开发者从"苦哈哈写每一行代码"转变为"保持对产品逻辑、用户流程、审美和交互的感觉",剩下的体力活交给 AI 编程工具。
|
||||
|
||||
## Karpathy 描述
|
||||
> "我几乎不写代码了,我只负责调整氛围(Vibe),代码会自动长出来。"
|
||||
|
||||
## 关键要素
|
||||
1. **规划驱动**:技术选型、实施规划、模块化设计先行
|
||||
2. **上下文固定**:保持 AI 理解一致,防止理解偏差
|
||||
3. **AI 结对执行**:AI 承担代码实现,开发者做导演
|
||||
|
||||
## 工具生态
|
||||
- [[Cursor]]
|
||||
- [[Windsurf]]
|
||||
- [[Trae]]
|
||||
- [[Claude Code]]
|
||||
|
||||
## 资源
|
||||
- [[vibe-coding-cn]]:中文开发者资源库
|
||||
|
||||
## 关联
|
||||
- [[AI编程]] ← 范畴
|
||||
- [[Prompt工程]] ← 演进基础
|
||||
|
||||
## Aliases
|
||||
- 氛围编程
|
||||
- Vibe Coding
|
||||
35
wiki/concepts/Workspace.md
Normal file
35
wiki/concepts/Workspace.md
Normal file
@@ -0,0 +1,35 @@
|
||||
---
|
||||
title: "Workspace"
|
||||
type: concept
|
||||
tags: [OpenClaw, Agent架构]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## 定义
|
||||
OpenClaw 中 Agent 的工作台目录(默认路径 `~/.openclaw/workspace/`),包含决定 Agent 如何工作的所有配置文件。sub-agent 也适用相同结构。
|
||||
|
||||
## 核心文件组成
|
||||
| 文件 | 职责 | 类型 |
|
||||
|------|------|------|
|
||||
| [[AGENTS.md]] | 岗位职责说明书 | 功能性 |
|
||||
| [[SOUL.md]] | 性格档案 | 人格性 |
|
||||
| [[USER.md]] | 用户偏好固化 | 上下文 |
|
||||
| [[TOOLS.md]] | 工具权限规范 | 安全性 |
|
||||
| [[IDENTITY.md]] | 结构化身份元数据 | 元数据 |
|
||||
| [[BOOTSTRAP.md]] | 一次性初始化引导 | 引导 |
|
||||
| memory/ | 长期记忆目录 | 持久化 |
|
||||
|
||||
## 与 agentDir 的区别
|
||||
- **Workspace**:决定 Agent 怎么工作(配置层)
|
||||
- **agentDir**:openclaw.json 中的配置字段,指向运行态目录(存储层)
|
||||
- **sessions**:工作日志,记录对话历史(历史层)
|
||||
|
||||
三者职责不同,不可混为一谈。
|
||||
|
||||
## 核心价值
|
||||
让 Agent 从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。
|
||||
|
||||
## Connections
|
||||
- [[Workspace]] ← 组成部分 ← [[AGENTS.md]] + [[SOUL.md]] + [[USER.md]] + [[TOOLS.md]] + [[IDENTITY.md]] + [[BOOTSTRAP.md]] + [[长期记忆]]
|
||||
- [[Workspace]] ← 属于 ← [[OpenClaw]]
|
||||
- [[长期记忆]] ← 承载 ← [[Workspace]]
|
||||
43
wiki/concepts/vLLM.md
Normal file
43
wiki/concepts/vLLM.md
Normal file
@@ -0,0 +1,43 @@
|
||||
---
|
||||
title: "vLLM"
|
||||
type: concept
|
||||
tags: [llm, inference-optimization, gpu]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
- **全称**:Virtual Large Language Model
|
||||
- **类型**:推理优化框架
|
||||
- **来源**:大模型相关术语和框架总结
|
||||
- **维护方**:vLLM 社区
|
||||
|
||||
## 定义
|
||||
vLLM 是开源项目,通过更好地利用 GPU 内存来加快大语言模型生成式 AI 应用的输出速度。
|
||||
|
||||
## 核心模块
|
||||
|
||||
### KV Cache
|
||||
- K 和 V 是每个 token 向量化后通过线性变换得到的向量,用于注意力计算
|
||||
- KV Cache 保存历史 K/V,避免重复计算
|
||||
- 显存开销随上下文长度、层数、头数、维度线性增长
|
||||
|
||||
### PagedAttention
|
||||
- 将 KV Cache 切分为固定大小的块(block)
|
||||
- 页表式映射管理,类操作系统虚拟内存
|
||||
- 避免连续内存分配导致的碎片化和 OOM
|
||||
- 支持多分支和重复前缀场景的 KV 块复用
|
||||
|
||||
### 连续批处理
|
||||
- 每个解码步骤(按 token 迭代)将活跃请求组装成一个批
|
||||
- 序列长度不同也能高效合批
|
||||
- GPU 基本满负载运转
|
||||
- 减少短任务被长任务阻塞的头阻塞
|
||||
|
||||
## 关联
|
||||
- [[LLM]] ← 优化对象
|
||||
- [[RAG]] ← 可结合使用
|
||||
- [[Embedding]] ← 向量化基础
|
||||
|
||||
## Aliases
|
||||
- vLLM
|
||||
- Virtual Large Language Model
|
||||
32
wiki/concepts/向量数据库.md
Normal file
32
wiki/concepts/向量数据库.md
Normal file
@@ -0,0 +1,32 @@
|
||||
---
|
||||
title: "向量数据库"
|
||||
type: concept
|
||||
tags: [vector-database, rag, embedding]
|
||||
sources: ["RAG从入门到精通系列1:基础RAG"]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
专门用于存储和检索高维 Embedding Vector 的数据库,支持多种相似度衡量方法,实现高效的语义检索。
|
||||
|
||||
## Core Functions
|
||||
- 存储 Embedding Vector 及关联元数据
|
||||
- 实现相似度检索(余弦相似度、点积、欧氏距离等)
|
||||
- 支持 Top-k 检索(返回最相似的 k 个结果)
|
||||
|
||||
## Popular Solutions
|
||||
| 数据库 | 特点 |
|
||||
|--------|------|
|
||||
| Qdrant | Rust 编写,开源,高性能 |
|
||||
| Pinecone | 云原生托管服务 |
|
||||
| Chroma | 轻量级,适合本地开发 |
|
||||
| Milvus | Apache 许可,开源 |
|
||||
| Weaviate | 混合搜索(向量+关键词) |
|
||||
|
||||
## Related Concepts
|
||||
- [[Embedding]]:向量数据库存储的对象
|
||||
- [[RAG]]:向量数据库的主要应用场景
|
||||
- [[Retrieval]]:向量数据库的核心能力
|
||||
|
||||
## Sources
|
||||
- [[RAG从入门到精通系列1:基础RAG]]
|
||||
33
wiki/concepts/数据蒸馏.md
Normal file
33
wiki/concepts/数据蒸馏.md
Normal file
@@ -0,0 +1,33 @@
|
||||
---
|
||||
title: "数据蒸馏"
|
||||
type: concept
|
||||
tags: [llm, model-compression]
|
||||
last_updated: 2025-12-20
|
||||
---
|
||||
|
||||
## 基本信息
|
||||
- **全称**:Data Distillation
|
||||
- **类型**:模型压缩技术
|
||||
- **来源**:大模型相关术语和框架总结
|
||||
|
||||
## 定义
|
||||
数据蒸馏是利用一个高性能的大模型生成精简但有价值的数据,使得一个小模型可以从中学习并逼近大模型的效果。
|
||||
|
||||
## 核心思想
|
||||
- 大模型(Teacher)生成高质量合成数据
|
||||
- 小模型(Student)从合成数据中学习
|
||||
- 目标:用更少参数达到接近大模型的性能
|
||||
|
||||
## 应用场景
|
||||
- 边缘设备部署(资源受限)
|
||||
- 降低推理成本
|
||||
- 特定领域模型快速训练
|
||||
|
||||
## 关联
|
||||
- [[LLM]] ← Teacher 模型
|
||||
- [[vLLM]] ← 推理优化
|
||||
|
||||
## Aliases
|
||||
- Data Distillation
|
||||
- 知识蒸馏
|
||||
- 模型蒸馏
|
||||
25
wiki/concepts/渐进式披露.md
Normal file
25
wiki/concepts/渐进式披露.md
Normal file
@@ -0,0 +1,25 @@
|
||||
---
|
||||
title: "渐进式披露"
|
||||
type: concept
|
||||
tags: [agent, skill, context-management]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
# 渐进式披露
|
||||
|
||||
## 定义
|
||||
ADK(Agent Development Kit)的机制,agent 只在运行时需要时才消耗上下文 token 来加载特定模式。
|
||||
|
||||
## 核心价值
|
||||
- 避免 context overflow
|
||||
- 只加载当前任务需要的 skill 组件
|
||||
- 提高 token 利用效率
|
||||
|
||||
## 在 Skill 设计中的应用
|
||||
- [[Tool Wrapper]]:只在触发关键词时加载规范
|
||||
- [[Reviewer]]:只在执行审查时加载检查清单
|
||||
- 5 种模式可组合,但不会全部同时加载
|
||||
|
||||
## Connections
|
||||
- [[ADK]]:实现机制
|
||||
- [[Agent Skill 设计模式]]:应用场景
|
||||
26
wiki/concepts/精准表达.md
Normal file
26
wiki/concepts/精准表达.md
Normal file
@@ -0,0 +1,26 @@
|
||||
---
|
||||
title: "精准表达"
|
||||
type: concept
|
||||
tags: [prompt-engineering, 思维方法]
|
||||
sources: ["如何写出完美的Prompt(提示词)?"]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
用清晰的逻辑组织信息,让 AI 快速抓取核心,核心是消除信息差——既消除人类需求与 AI 理解之间的信息差,也消除任务目标与执行标准之间的信息差。
|
||||
|
||||
## Core Elements
|
||||
- 动词明确:避免模糊词表述(如"做一下""弄个")
|
||||
- 对象明确:明确核心内容
|
||||
- 约束明确:明确边界条件
|
||||
|
||||
## Related Concepts
|
||||
- [[结构化思维]]:精准表达的思维基础
|
||||
- [[需求拆解]]:精准表达在 Prompt 中的具体形态
|
||||
|
||||
## Key Distinction
|
||||
- 误区:越复杂越专业,过度堆砌术语和格式
|
||||
- 真相:Prompt 的专业性不在于复杂程度,而在于精准匹配
|
||||
|
||||
## Sources
|
||||
- [[如何写出完美的Prompt(提示词)?]]
|
||||
24
wiki/concepts/结构化思维.md
Normal file
24
wiki/concepts/结构化思维.md
Normal file
@@ -0,0 +1,24 @@
|
||||
---
|
||||
title: "结构化思维"
|
||||
type: concept
|
||||
tags: [prompt-engineering, 思维方法]
|
||||
sources: ["如何写出完美的Prompt(提示词)?"]
|
||||
last_updated: 2026-04-15
|
||||
---
|
||||
|
||||
## Definition
|
||||
将模糊目标拆解为具体、可执行的子任务,用清晰的逻辑组织信息,让 AI 快速抓取核心。
|
||||
|
||||
## Core Elements
|
||||
- 核心指令前置:避免冗余信息干扰
|
||||
- 分层呈现信息:用标题、序号、分段区分核心任务、背景信息、约束条件
|
||||
- 逻辑关系明确:用连接词清晰呈现任务逻辑链条
|
||||
|
||||
## Related Concepts
|
||||
- [[精准表达]]:结构化思维的输出层面
|
||||
- [[需求拆解]]:结构化思维在 Prompt 构建中的具体应用
|
||||
- [[任务拆分法]]:结构化思维在复杂任务中的扩展应用
|
||||
|
||||
## Examples
|
||||
- 按"业务流程递进"拆分(如白皮书:收集数据→分析痛点→设计框架→填充内容→优化语言)
|
||||
- 用总-分-总、维度拆解等逻辑框架组织 Prompt
|
||||
Reference in New Issue
Block a user