Source pages (6): - Google-5个Agent-Skill设计模式 - n8n-configure-telegram-trigger - n8n-docker-install-update - n8n-full-tutorial-building-ai-agents - n8n+Claude通过自然语言自动化工作流 - phone-based-personal-assistant New entities (2): Google, ClawdTalk New concepts (6): AgentSkill设计模式, ToolWrapper, Generator, Reviewer, Inversion, Pipeline
5.2 KiB
5.2 KiB
Overview
本Wiki涵盖两大核心领域:Agent(智能体)系统和AI应用。Agent系统以OpenClaw、N8N、MCP为核心;AI应用涵盖图像生成、配音克隆、视频制作、RAG检索等场景。
核心主题
Agent系统
- OpenClaw:开源AI Agent框架,支持多Agent协作、记忆系统、技能扩展
- N8N:开源工作流自动化平台,可与AI Agent结合实现复杂自动化
- MCP (Modal Context Protocol):AI大模型与外围服务集成的协议
- 多Agent系统:多个专业Agent协同工作的架构模式
AI应用
- 图像生成:Nano Banana、Midjourney等模型的提示词工程
- AI配音与声音克隆:ElevenLabs、海螺AI、F5-TTS等工具
- 视频制作:固定镜头短视频AI全流程、九宫格法、首尾针动画
- RAG检索:检索增强生成解决LLM幻觉问题
问题域
Agent系统
- Agent开发与配置(Workspace文件体系)
- 工作流自动化(N8N节点和工作流)
- 跨平台集成(Telegram、Discord、Slack等)
- 个人效率提升(习惯追踪、日历管理、邮件处理)
- 内容创作自动化(YouTube、Twitter、播客等)
- 商业应用(CRM、市场研究、财报追踪)
AI应用
- 提示词工程:角色-需求-场景-目标四要素结构
- 图像生成质量控制:物件描述框架、人物描述框架
- 声音克隆与配音:多语言TTS、各平台特点
- 视频内容创作:分镜拆解、一致性保证
- 大模型知识体系:LLM、MCP、Agent、RAG、vLLM、Token
方法/机制
Agent系统
- Workspace文件体系(AGENTS.md、SOUL.md、USER.md等):定义Agent行为
- Sub-agent多Agent协作:分散式协调通过共享状态文件
- Cron定时任务与心跳机制:自动化定期执行
- MCP协议工具调用:Client-Server架构的服务集成
- Cursor集成调用:支持SSE与Command模式的代理调用与推理工具链
- Webhook安全集成:OpenClaw与N8N的安全集成模式
- 向量语义搜索:memsearch实现记忆的语义检索
AI应用
- 提示词框架:物件描述、人物描述的JSON标准化结构
- Source-Grounding:NotebookLM限制知识库确保回答准确性
- 九宫格法:一次性生成多个分镜保证画面一致性
- 首尾针动画:AI补齐中间帧实现平滑过渡
- RAG三步流程:索引→检索→生成
关键实体
Agent系统
- OpenClaw:开源AI Agent框架
- N8N:工作流自动化平台
- MCP:模态上下文协议
- Cursor:集成MCP的高级代码大模型编辑器
- Smisery:热点新闻MCP服务数据源
- DenchClaw:本地CRM框架
- AionUi:桌面Cowork应用
- Google:发布Agent Skill设计模式的云服务提供商
- ClawdTalk:OpenClaw电话集成工具,实现语音交互
AI应用
- NotebookLM:Google AI学习工具
- Nano Banana:Google AI图像生成模型
- DeepSider:多AI模型聚合浏览器插件
- ElevenLabs:国际AI配音平台
- 海螺AI:MiniMax出品的AI工具
- F5-TTS:开源语音克隆项目
- 剪映:字节跳动视频编辑工具
关键概念
Agent系统
- Workspace:Agent的工作台目录配置体系
- 多Agent系统:多个专业Agent协同工作的架构
- 工作流自动化:使用工具自动执行重复性任务
- 记忆系统:Agent跨会话保留上下文的能力
- 技能系统:OpenClaw的扩展机制
- Agent模式:模型自动执行工具命令的交互模式
- AgentSkill设计模式:Google与Anthropic总结的5种Skill设计模式(ToolWrapper、Generator、Reviewer、Inversion、Pipeline)
- SequentialThinking:大模型的逻辑推理任务分步拆解机制
- n8n-mcp:N8N的MCP服务器实现
- idea-reality-mcp:预构建创意验证MCP
AI应用
- Prompt能力:清晰界定需求+结构化思维表达
- 需求拆解:将模糊目标转化为具体可执行子任务
- 结构化表达:用清晰逻辑组织信息
- 思维链引导:让AI逐步推理
- Source-Grounding:限制知识库确保AI回答准确性
- 音频概览:将文档转化为AI双人播客格式
- 提示词框架:结构化描述图像生成需求的模板
- AI配音:文本转语音技术
- 声音克隆:用少量样本重建个人声音
- 固定机位:摄像机位置固定不变的拍摄方式
- 首尾针动画:通过首尾帧AI自动补齐中间动作
- 九宫格法:一次性生成3x3共九个分镜画面
- RAG:检索增强生成
- Embedding:将文本转换为数值向量的技术
- LLM:大语言模型
- Agent:智能体
- vLLM:高效LLM推理框架
- Token:大模型基本输入单元
Source分类
Agent系统(45个)
涵盖:OpenClaw Workspace、N8N工作流、MCP协议、多Agent协作、记忆系统、技能扩展等
AI应用(26个)
涵盖:NotebookLM、Claude Skills、Nano Banana提示词、RAG基础、AI配音工具、视频制作流程、大模型术语等
来源分布
- 微信公众号:Agent系统相关内容
- YouTube视频:部分AI工具教程
- OpenClaw Use Cases:37个
- 技术文档:AI图像生成、RAG、提示词工程等