120 lines
4.9 KiB
Markdown
120 lines
4.9 KiB
Markdown
# Overview
|
||
|
||
本Wiki涵盖两大核心领域:**Agent(智能体)系统**和**AI应用**。Agent系统以OpenClaw、N8N、MCP为核心;AI应用涵盖图像生成、配音克隆、视频制作、RAG检索等场景。
|
||
|
||
## 核心主题
|
||
|
||
### Agent系统
|
||
- **OpenClaw**:开源AI Agent框架,支持多Agent协作、记忆系统、技能扩展
|
||
- **N8N**:开源工作流自动化平台,可与AI Agent结合实现复杂自动化
|
||
- **MCP (Modal Context Protocol)**:AI大模型与外围服务集成的协议
|
||
- **多Agent系统**:多个专业Agent协同工作的架构模式
|
||
|
||
### AI应用
|
||
- **图像生成**:Nano Banana、Midjourney等模型的提示词工程
|
||
- **AI配音与声音克隆**:ElevenLabs、海螺AI、F5-TTS等工具
|
||
- **视频制作**:固定镜头短视频AI全流程、九宫格法、首尾针动画
|
||
- **RAG检索**:检索增强生成解决LLM幻觉问题
|
||
|
||
## 问题域
|
||
|
||
### Agent系统
|
||
- Agent开发与配置(Workspace文件体系)
|
||
- 工作流自动化(N8N节点和工作流)
|
||
- 跨平台集成(Telegram、Discord、Slack等)
|
||
- 个人效率提升(习惯追踪、日历管理、邮件处理)
|
||
- 内容创作自动化(YouTube、Twitter、播客等)
|
||
- 商业应用(CRM、市场研究、财报追踪)
|
||
|
||
### AI应用
|
||
- 提示词工程:角色-需求-场景-目标四要素结构
|
||
- 图像生成质量控制:物件描述框架、人物描述框架
|
||
- 声音克隆与配音:多语言TTS、各平台特点
|
||
- 视频内容创作:分镜拆解、一致性保证
|
||
- 大模型知识体系:LLM、MCP、Agent、RAG、vLLM、Token
|
||
|
||
## 方法/机制
|
||
|
||
### Agent系统
|
||
- **Workspace文件体系**(AGENTS.md、SOUL.md、USER.md等):定义Agent行为
|
||
- **Sub-agent多Agent协作**:分散式协调通过共享状态文件
|
||
- **Cron定时任务与心跳机制**:自动化定期执行
|
||
- **MCP协议工具调用**:Client-Server架构的服务集成
|
||
- **Cursor集成调用**:支持SSE与Command模式的代理调用与推理工具链
|
||
- **Webhook安全集成**:OpenClaw与N8N的安全集成模式
|
||
- **向量语义搜索**:memsearch实现记忆的语义检索
|
||
|
||
### AI应用
|
||
- **提示词框架**:物件描述、人物描述的JSON标准化结构
|
||
- **Source-Grounding**:NotebookLM限制知识库确保回答准确性
|
||
- **九宫格法**:一次性生成多个分镜保证画面一致性
|
||
- **首尾针动画**:AI补齐中间帧实现平滑过渡
|
||
- **RAG三步流程**:索引→检索→生成
|
||
|
||
## 关键实体
|
||
|
||
### Agent系统
|
||
- [[OpenClaw]]:开源AI Agent框架
|
||
- [[N8N]]:工作流自动化平台
|
||
- [[MCP]]:模态上下文协议
|
||
- [[Cursor]]:集成MCP的高级代码大模型编辑器
|
||
- [[Smisery]]:热点新闻MCP服务数据源
|
||
- [[DenchClaw]]:本地CRM框架
|
||
- [[AionUi]]:桌面Cowork应用
|
||
|
||
### AI应用
|
||
- [[NotebookLM]]:Google AI学习工具
|
||
- [[Nano Banana]]:Google AI图像生成模型
|
||
- [[DeepSider]]:多AI模型聚合浏览器插件
|
||
- [[ElevenLabs]]:国际AI配音平台
|
||
- [[海螺AI]]:MiniMax出品的AI工具
|
||
- [[F5-TTS]]:开源语音克隆项目
|
||
- [[剪映]]:字节跳动视频编辑工具
|
||
|
||
## 关键概念
|
||
|
||
### Agent系统
|
||
- [[Workspace]]:Agent的工作台目录配置体系
|
||
- [[多Agent系统]]:多个专业Agent协同工作的架构
|
||
- [[工作流自动化]]:使用工具自动执行重复性任务
|
||
- [[记忆系统]]:Agent跨会话保留上下文的能力
|
||
- [[技能系统]]:OpenClaw的扩展机制
|
||
- [[Agent模式]]:模型自动执行工具命令的交互模式
|
||
- [[SequentialThinking]]:大模型的逻辑推理任务分步拆解机制
|
||
- [[n8n-mcp]]:N8N的MCP服务器实现
|
||
- [[idea-reality-mcp]]:预构建创意验证MCP
|
||
|
||
### AI应用
|
||
- [[Prompt能力]]:清晰界定需求+结构化思维表达
|
||
- [[需求拆解]]:将模糊目标转化为具体可执行子任务
|
||
- [[结构化表达]]:用清晰逻辑组织信息
|
||
- [[思维链引导]]:让AI逐步推理
|
||
- [[Source-Grounding]]:限制知识库确保AI回答准确性
|
||
- [[音频概览]]:将文档转化为AI双人播客格式
|
||
- [[提示词框架]]:结构化描述图像生成需求的模板
|
||
- [[AI配音]]:文本转语音技术
|
||
- [[声音克隆]]:用少量样本重建个人声音
|
||
- [[固定机位]]:摄像机位置固定不变的拍摄方式
|
||
- [[首尾针动画]]:通过首尾帧AI自动补齐中间动作
|
||
- [[九宫格法]]:一次性生成3x3共九个分镜画面
|
||
- [[RAG]]:检索增强生成
|
||
- [[Embedding]]:将文本转换为数值向量的技术
|
||
- [[LLM]]:大语言模型
|
||
- [[Agent]]:智能体
|
||
- [[vLLM]]:高效LLM推理框架
|
||
- [[Token]]:大模型基本输入单元
|
||
|
||
## Source分类
|
||
|
||
### Agent系统(45个)
|
||
涵盖:OpenClaw Workspace、N8N工作流、MCP协议、多Agent协作、记忆系统、技能扩展等
|
||
|
||
### AI应用(26个)
|
||
涵盖:NotebookLM、Claude Skills、Nano Banana提示词、RAG基础、AI配音工具、视频制作流程、大模型术语等
|
||
|
||
## 来源分布
|
||
- 微信公众号:Agent系统相关内容
|
||
- YouTube视频:部分AI工具教程
|
||
- OpenClaw Use Cases:37个
|
||
- 技术文档:AI图像生成、RAG、提示词工程等
|