nexus/wiki/overview.md

# Overview

本Wiki涵盖两大核心领域：**Agent（智能体）系统**和**AI应用**。Agent系统以OpenClaw、N8N、MCP为核心；AI应用涵盖图像生成、配音克隆、视频制作、RAG检索等场景。

## 核心主题

### Agent系统
- **OpenClaw**：开源AI Agent框架，支持多Agent协作、记忆系统、技能扩展
- **N8N**：开源工作流自动化平台，可与AI Agent结合实现复杂自动化
- **MCP (Modal Context Protocol)**：AI大模型与外围服务集成的协议
- **多Agent系统**：多个专业Agent协同工作的架构模式

### AI应用
- **图像生成**：Nano Banana、Midjourney等模型的提示词工程
- **AI配音与声音克隆**：ElevenLabs、海螺AI、F5-TTS等工具
- **视频制作**：固定镜头短视频AI全流程、九宫格法、首尾针动画
- **RAG检索**：检索增强生成解决LLM幻觉问题

## 问题域

### Agent系统
- Agent开发与配置（Workspace文件体系）
- 工作流自动化（N8N节点和工作流）
- 跨平台集成（Telegram、Discord、Slack等）
- 个人效率提升（习惯追踪、日历管理、邮件处理）
- 内容创作自动化（YouTube、Twitter、播客等）
- 商业应用（CRM、市场研究、财报追踪）

### AI应用
- 提示词工程：角色-需求-场景-目标四要素结构
- 图像生成质量控制：物件描述框架、人物描述框架
- 声音克隆与配音：多语言TTS、各平台特点
- 视频内容创作：分镜拆解、一致性保证
- 大模型知识体系：LLM、MCP、Agent、RAG、vLLM、Token

## 方法/机制

### Agent系统
- **Workspace文件体系**（AGENTS.md、SOUL.md、USER.md等）：定义Agent行为
- **Sub-agent多Agent协作**：分散式协调通过共享状态文件
- **Cron定时任务与心跳机制**：自动化定期执行
- **MCP协议工具调用**：Client-Server架构的服务集成
- **Cursor集成调用**：支持SSE与Command模式的代理调用与推理工具链
- **Webhook安全集成**：OpenClaw与N8N的安全集成模式
- **向量语义搜索**：memsearch实现记忆的语义检索

### AI应用
- **提示词框架**：物件描述、人物描述的JSON标准化结构
- **Source-Grounding**：NotebookLM限制知识库确保回答准确性
- **九宫格法**：一次性生成多个分镜保证画面一致性
- **首尾针动画**：AI补齐中间帧实现平滑过渡
- **RAG三步流程**：索引→检索→生成

## 关键实体

### Agent系统
- [[OpenClaw]]：开源AI Agent框架
- [[N8N]]：工作流自动化平台
- [[MCP]]：模态上下文协议
- [[Cursor]]：集成MCP的高级代码大模型编辑器
- [[Smisery]]：热点新闻MCP服务数据源
- [[DenchClaw]]：本地CRM框架
- [[AionUi]]：桌面Cowork应用

### AI应用
- [[NotebookLM]]：Google AI学习工具
- [[Nano Banana]]：Google AI图像生成模型
- [[DeepSider]]：多AI模型聚合浏览器插件
- [[ElevenLabs]]：国际AI配音平台
- [[海螺AI]]：MiniMax出品的AI工具
- [[F5-TTS]]：开源语音克隆项目
- [[剪映]]：字节跳动视频编辑工具

## 关键概念

### Agent系统
- [[Workspace]]：Agent的工作台目录配置体系
- [[多Agent系统]]：多个专业Agent协同工作的架构
- [[工作流自动化]]：使用工具自动执行重复性任务
- [[记忆系统]]：Agent跨会话保留上下文的能力
- [[技能系统]]：OpenClaw的扩展机制
- [[Agent模式]]：模型自动执行工具命令的交互模式
- [[SequentialThinking]]：大模型的逻辑推理任务分步拆解机制
- [[n8n-mcp]]：N8N的MCP服务器实现
- [[idea-reality-mcp]]：预构建创意验证MCP

### AI应用
- [[Prompt能力]]：清晰界定需求+结构化思维表达
- [[需求拆解]]：将模糊目标转化为具体可执行子任务
- [[结构化表达]]：用清晰逻辑组织信息
- [[思维链引导]]：让AI逐步推理
- [[Source-Grounding]]：限制知识库确保AI回答准确性
- [[音频概览]]：将文档转化为AI双人播客格式
- [[提示词框架]]：结构化描述图像生成需求的模板
- [[AI配音]]：文本转语音技术
- [[声音克隆]]：用少量样本重建个人声音
- [[固定机位]]：摄像机位置固定不变的拍摄方式
- [[首尾针动画]]：通过首尾帧AI自动补齐中间动作
- [[九宫格法]]：一次性生成3x3共九个分镜画面
- [[RAG]]：检索增强生成
- [[Embedding]]：将文本转换为数值向量的技术
- [[LLM]]：大语言模型
- [[Agent]]：智能体
- [[vLLM]]：高效LLM推理框架
- [[Token]]：大模型基本输入单元

## Source分类

### Agent系统（45个）
涵盖：OpenClaw Workspace、N8N工作流、MCP协议、多Agent协作、记忆系统、技能扩展等

### AI应用（26个）
涵盖：NotebookLM、Claude Skills、Nano Banana提示词、RAG基础、AI配音工具、视频制作流程、大模型术语等

## 来源分布
- 微信公众号：Agent系统相关内容
- YouTube视频：部分AI工具教程
- OpenClaw Use Cases：37个
- 技术文档：AI图像生成、RAG、提示词工程等