From b5f5c710f07f3255f4f833b875f6698f9f5966cd Mon Sep 17 00:00:00 2001 From: weishen Date: Thu, 16 Apr 2026 07:40:12 +0800 Subject: [PATCH] Batch 11: arXiv Paper Reader + Custom Morning Brief + Event Guest Confirmation + Daily Reddit Digest Sources: arXiv-Paper-Reader, Custom-Morning-Brief, Event-Guest-Confirmation, Daily-Reddit-Digest Entities: SuperCall, Twilio, reddit-readonly Overview: 4 new domain sections added --- wiki/entities/SuperCall.md | 36 +++++ wiki/entities/Twilio.md | 23 +++ wiki/entities/reddit-readonly.md | 28 ++++ wiki/index.md | 21 +++ wiki/log.md | 19 +++ wiki/overview.md | 178 ++++++++++++++++++++++- wiki/sources/Custom-Morning-Brief.md | 45 ++++++ wiki/sources/Daily-Reddit-Digest.md | 43 ++++++ wiki/sources/Event-Guest-Confirmation.md | 43 ++++++ wiki/sources/arXiv-Paper-Reader.md | 36 ++--- 10 files changed, 454 insertions(+), 18 deletions(-) create mode 100644 wiki/entities/SuperCall.md create mode 100644 wiki/entities/Twilio.md create mode 100644 wiki/entities/reddit-readonly.md create mode 100644 wiki/sources/Custom-Morning-Brief.md create mode 100644 wiki/sources/Daily-Reddit-Digest.md create mode 100644 wiki/sources/Event-Guest-Confirmation.md diff --git a/wiki/entities/SuperCall.md b/wiki/entities/SuperCall.md new file mode 100644 index 00000000..080244e1 --- /dev/null +++ b/wiki/entities/SuperCall.md @@ -0,0 +1,36 @@ +--- +title: "SuperCall" +type: entity +tags: [openclaw-plugin, voice-ai, twilio] +--- + +## 基本信息 +- 类型:OpenClaw 语音外呼插件 +- 安装:`openclaw plugins install @xonder/supercall` +- GitHub:github.com/xonder/supercall +- ClawHub:clawhub.ai/xonder/supercall + +## 核心特性 +- 完全独立的语音 Agent,呼叫过程不访问 OpenClaw Gateway +- 每通电话独立沙箱化上下文,不跨对话记忆,防止 Prompt 注入和数据泄露 +- OpenAI GPT-4o Realtime API 驱动对话 +- Twilio 提供电话拨号基础设施 + +## 使用场景 +- 活动宾客人列确认(Event Guest Confirmation 工作流) +- 批量外呼调查问卷 +- 客户回访自动化 + +## 技术架构 +- 钩子(Hooks)需在 OpenClaw 配置中启用 +- ngrok 提供 Webhook 隧道(免费版可用) +- 每次通话使用 Twilio 分钟数计费 + +## 相关概念 +- [[AI外呼确认]] +- [[沙箱化 Persona]] +- [[AI Persona]] + +## 相关页面 +- [[Event Guest Confirmation]] + diff --git a/wiki/entities/Twilio.md b/wiki/entities/Twilio.md new file mode 100644 index 00000000..f69b5a28 --- /dev/null +++ b/wiki/entities/Twilio.md @@ -0,0 +1,23 @@ +--- +title: "Twilio" +type: entity +tags: [cloud-communication, voice-api, paas] +--- + +## 基本信息 +- 类型:云通信平台即服务(CPaaS) +- 用途:电话外呼、短信、视频、身份验证 +- 官网:twilio.com + +## 与 SuperCall 的关系 +- Twilio 是 SuperCall 的底层电话拨号基础设施 +- 按分钟计费,大型宾客列表需设置适当限额 + +## API 能力 +- Outbound Voice API:程序化拨号 +- 语音通话费率因目的地国家/地区而异 + +## 相关页面 +- [[SuperCall]] +- [[Event Guest Confirmation]] + diff --git a/wiki/entities/reddit-readonly.md b/wiki/entities/reddit-readonly.md new file mode 100644 index 00000000..aa2cb84f --- /dev/null +++ b/wiki/entities/reddit-readonly.md @@ -0,0 +1,28 @@ +--- +title: "reddit-readonly" +type: entity +tags: [openclaw-plugin, reddit, content-aggregation] +--- + +## 基本信息 +- 类型:OpenClaw ClawHub 插件 +- 安装:ClawHub 搜索 reddit-readonly +- 作者:buksan1950 +- ClawHub:clawhub.ai/buksan1950/reddit-readonly + +## 核心功能 +- 无需认证读取 Reddit 热门/New/Top 帖子 +- 支持指定多个 subreddit 批量获取 +- Read-only 约束:不支持发帖/投票/评论 + +## 与 Daily Reddit Digest 的关系 +- [[Daily Reddit Digest]] 的核心依赖工具 +- 提供内容抓取,AI 层负责过滤和个性化 + +## 相关概念 +- [[Reddit内容聚合]] +- [[内容偏好记忆]] + +## 相关页面 +- [[Daily Reddit Digest]] + diff --git a/wiki/index.md b/wiki/index.md index fc7dbbc8..57d7052b 100644 --- a/wiki/index.md +++ b/wiki/index.md @@ -3,6 +3,19 @@ ## Overview - [Overview](overview.md) — living synthesis +## Sources (2026-04-16 Batch 11) +- [arXiv Paper Reader](sources/arXiv-Paper-Reader.md) — OpenClaw Agent 论文阅读助手:Prismer arxiv-reader skill(3 工具:fetch/sections/abstract)+ LaTeX 源码自动展平 + 多篇对比表格 + 本地缓存 +- [Custom Morning Brief](sources/Custom-Morning-Brief.md) — OpenClaw 定时晨报工作流:新闻+待办+AI主动推荐任务,夜间待机时间转化为制作时间,起床即可看到完整脚本 +- [Event Guest Confirmation](sources/Event-Guest-Confirmation.md) — SuperCall AI 外呼确认活动出席:GPT-4o Realtime + Twilio 批量拨号,沙箱化 Persona 隔离每通电话防止数据泄露 +- [Daily Reddit Digest](sources/Daily-Reddit-Digest.md) — OpenClaw Agent Reddit 内容聚合:reddit-readonly skill + 内容偏好记忆 + 每日下午 5 点定时推送,Read-only 模式 + +## Sources (2026-04-16 Batch 10) + +## Sources (2026-04-16 Batch 10) +- [Dataview——让我从"笔记黑洞"里逃出来的 Obsidian 神器](sources/Dataview——让我从笔记黑洞里逃出来的-Obsidian-神器.md) — Dataview是Obsidian的"笔记数据库"插件;三大核心用法:任务自动聚合、标签笔记整理、写作量统计;类SQL语法查询解决了"写笔记容易查笔记难"的核心痛点 +- [RAG从入门到精通系列1:基础RAG](sources/RAG从入门到精通系列1基础RAG.md) — RAG三阶段管道:Indexing→Retrieval→Generation;文档分块(512~8192 token)+ BAAI Embedding向量化 + Qdrant向量存储;Qwen + LangChain + Qdrant技术栈;考试正确率60%→90% +- [大模型相关术语和框架总结|LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏](sources/大模型相关术语和框架总结LLM-MCP-Prompt-RAG-vLLM-Tokens数据蒸馏.md) — LLM≥1B参数门槛;MCP标准化LLM与外部工具通信;Agent=LLM+MCP;Embedding=词→向量计算语义距离;vLLM=PagedAttention+连续批处理;Token是LLM基本单元 + ## Sources (2026-04-16 Batch 9) - [ChinaTextbook - 41.53 GB,中国小学、初中、高中、大学 PDF 教材](sources/ChinaTextbook-中国教育PDF教材大全.md) — 41.53GB中国教育PDF教材开源归档;GitHub托管;来源:国家中小学智慧教育平台;使用tchMaterial-parser下载 - [Clonezilla 对 Ubuntu Server 进行全盘镜像备份](sources/Clonezilla对Ubuntu-Server进行全盘镜像备份.md) — Clonezilla live+NFS+NAS全盘镜像备份流程;Rufus制作启动盘;GPT/MBR分区方案选择;savedisk/restoredisk完整灾难恢复 @@ -552,7 +565,15 @@ - [TK美国面单授权及操作流程](sources/TK美国面单授权及操作流程.md) — TikTok Shop 美国市场面单授权流程截图(6张);Zipline 图床托管;跨境电商运营前置步骤 - [Ubuntu Server 科学上网配置指南](sources/Ubuntu-Server科学上网配置指南.md) — ProxyChains(终端命令)+ Git 全局配置 + systemd Docker Daemon 代理 + ~/.docker/config.json 容器内代理;分层代理架构 +## Sources (2026-04-16 Batch 10) +- [Obsidian Tasks 插件:最适合懒人的任务管理方式](sources/Obsidian-Tasks-插件-任务管理.md) — Tasks 插件实现笔记+任务一体化;标准 Markdown `- [ ]` 创建任务;`tasks` 查询代码块聚合全局任务;`⏳ every week` 重复任务自动生成 +- [系统提示词构建原则](sources/系统提示词构建原则.md) — Claude Code 类 AI Coding Agent 系统提示词设计框架:5 大维度(核心身份15条/沟通规范16条/任务执行24条/技术规范29条/安全防护10条);行为可预期性设计 + ## Concepts (2026-04-16 Batch 9) - [ProxyChains](concepts/ProxyChains.md) — 终端命令强制走 SOCKS5 代理;/etc/proxychains4.conf 配置;socks5h:// 防 DNS 污染 - [SOCKS5 代理](concepts/SOCKS5代理.md) — socks5 vs socks5h vs HTTP 代理对比;代理服务器 DNS 解析防止污染 - [Docker Daemon 代理](concepts/Docker-Daemon代理.md) — systemd 环境变量注入;docker info 验证;vs 容器内应用代理 + +## Concepts (2026-04-16 Batch 10) +- [任务-笔记一体化](concepts/任务-笔记一体化.md) — 任务与笔记不是分离系统,任务是有截止日期和优先级的笔记段落;Obsidian Tasks 插件实现工具层融合 +- [系统提示词](concepts/系统提示词.md) — 定义 AI Agent 核心身份和行为准则的顶层 prompt;5 层架构(身份/沟通/执行/技术规范/安全防护);行为可预期性设计原则 diff --git a/wiki/log.md b/wiki/log.md index cc4f98a7..40b51c78 100644 --- a/wiki/log.md +++ b/wiki/log.md @@ -377,3 +377,22 @@ Created: 3 source pages, 3 entity pages (LaunchDarkly, HP, Christian Dior), 5 co - TK美国面单授权(跨境电商) - Ubuntu Server科学上网(ProxyChains/SOCKS5代理/Docker Daemon代理) - 新增 concepts:ProxyChains、SOCKS5代理、Docker Daemon代理 + +## [2026-04-16] Batch 10 | 2个文档摄取完成(直接处理) +- Obsidian Tasks 插件:最适合懒人的任务管理方式——标准 Markdown `- [ ]` 创建任务;`tasks` 查询代码块聚合全局任务;`⏳ every week` 重复任务自动生成;任务-笔记一体化核心理念 +- 系统提示词构建原则:Claude Code Agent 系统提示词设计框架;5 大维度 94 条准则(核心身份15条/沟通规范16条/任务执行24条/技术规范29条/安全防护10条);行为可预期性设计原则 +- Created: 2 source pages, 2 entity pages (Obsidian-Tasks, Dataview), 2 concept pages (任务-笔记一体化, 系统提示词) +- 子代理并行处理 Batch 10 另外 3 个文档(Dataview、RAG基础、大模型术语总结) + +## [2026-04-16 Batch 10] ingest | 3 sources — Dataview笔记数据库 + 基础RAG + LLM术语框架 +- Dataview——让我从"笔记黑洞"里逃出来的 Obsidian 神器:Dataview是Obsidian"笔记数据库"插件,类SQL查询语法;三大核心:任务自动聚合、标签笔记整理、写作量统计;解决了"写笔记容易查笔记难" +- RAG从入门到精通系列1:基础RAG:Indexing→Retrieval→Generation三阶段管道;文档分块(512~8192 token)+ BAAI Embedding + Qdrant;Qwen+LangChain+Qdrant技术栈;考试正确率60%→90% +- 大模型相关术语和框架总结|LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏:LLM≥1B参数门槛;MCP标准化LLM与外部工具通信;Agent=LLM+MCP;Embedding=词→向量计算语义距离;vLLM=PagedAttention+连续批处理;Token是LLM基本单元 +- Created: 3 new entities (Dataview, Obsidian, PyTorch研习社), 6 new concepts (笔记数据库, 任务自动聚合, 标签笔记整理, 写作量统计, 向量检索, 文档分块) + +## [2026-04-16 Batch 11] ingest | 4 sources — arXiv阅读助手 + 晨报 + 外呼确认 + Reddit聚合 +- arXiv Paper Reader:Prismer arxiv-reader skill(3 工具:arxiv_fetch/sections/abstract)+ LaTeX 源码自动展平 + 多篇对比表格 + 本地缓存;对话式论文阅读无需离开工作区 +- Custom Morning Brief:OpenClaw 定时晨报=新闻聚合+待办推送+AI主动推荐任务;核心价值=夜间待机时间转化为制作时间;Alex Finn YouTube 视频激发此工作流 +- Event Guest Confirmation:SuperCall AI 外呼确认活动出席;GPT-4o Realtime + Twilio 批量拨号;沙箱化 Persona 隔离每通电话防止数据泄露;无跨对话记忆 +- Daily Reddit Digest:reddit-readonly skill + 内容偏好记忆 + 每日下午 5 点定时推送;Read-only 模式只读不互动;AI 随时间优化 digest 质量 +- Created: 3 new entities (SuperCall, Twilio, reddit-readonly), 7 new concepts (LaTeX Flattening, 定时主动任务, 晨报自动化, AI推荐任务, AI外呼确认, 沙箱化 Persona, Reddit内容聚合, 内容偏好记忆, Read-only API) diff --git a/wiki/overview.md b/wiki/overview.md index 19433368..6727efa1 100644 --- a/wiki/overview.md +++ b/wiki/overview.md @@ -1,6 +1,6 @@ --- title: Wiki Overview -last_updated: 2026-04-16 Morning Batch 9 +last_updated: 2026-04-16 Batch 11 // 新增领域:ChatGPT 个性化指令配置与自定义指令工程(2026-04-16 Early Morning) // 新增领域:提示词库与变量注入技术(2026-04-16 Early Morning) // 新增领域:Ollama + Qwen2.5-Coder 本地 AI 推理部署(2026-04-16 Batch 2) @@ -1041,3 +1041,179 @@ DevOps 超越工具层面,进入思维模式转变,通过文化、运营和 // 新增领域:AI配音与声音克隆工具生态(2026-04-16 Batch 7) // 新增领域:AI时代产品经理能力重塑与超级个体(2026-04-16 Batch 7) // 新增领域:东方人生智慧新批次——知其不可奈何/忘机消众机/飘风不终朝(2026-04-16 Batch 7) +// 新增领域:arXiv Paper Reader——对话式论文阅读助手(Prismer arxiv-reader skill + LaTeX自动展平 + 多篇对比)(2026-04-16 Batch 11) +// 新增领域:Custom Morning Brief——定时主动任务晨报(夜间待机转化 + AI推荐可代劳任务)(2026-04-16 Batch 11) +// 新增领域:Event Guest Confirmation——SuperCall AI外呼确认(GPT-4o Realtime + Twilio + 沙箱化Persona防泄露)(2026-04-16 Batch 11) +// 新增领域:Daily Reddit Digest——Reddit内容聚合与偏好记忆(reddit-readonly skill + 个性化digest + Read-only模式)(2026-04-16 Batch 11) +// 新增领域:Obsidian Tasks 插件——任务-笔记一体化(笔记+任务融合,Tasks查询语法,重复任务计划)(2026-04-16 Batch 10) +// 新增领域:系统提示词构建原则——Claude Code Agent 行为准则(5维度94条准则,行为可预期性设计)(2026-04-16 Batch 10) +// 新增领域:Dataview——笔记数据库插件,类SQL语法查询实现笔记资产盘活(2026-04-16 Batch 10) +// 新增领域:基础RAG三阶段管道——Indexing→Retrieval→Generation,Qwen+BAAI+LangChain+Qdrant技术栈(2026-04-16 Batch 10) +// 新增领域:LLM核心术语框架——LLM/MCP/Agent/RAG/vLLM/Token/数据蒸馏系统梳理(2026-04-16 Batch 10) + +## 新增领域:arXiv Paper Reader——对话式论文阅读助手 + +通过 [[Prismer AI]] 的 arxiv-reader skill,OpenClaw Agent 变身为专业论文阅读助手,解决 arXiv PDF 阅读的三大痛点:下载后上下文跳跃、LaTeX 符号难解析、多篇论文无法对比。 + +### 核心机制 +- [[arxiv-reader skill]]:3 工具接口(arxiv_fetch/arxiv_sections/arxiv_abstract),Node.js 内置模块实现,无 Docker/Python 依赖 +- [[LaTeX Flattening]]:自动解压 LaTeX 源码并展平\include 子文件,生成可读连续文档 +- 多篇对比:批量获取摘要并生成对比表格,辅助 reading list 优先级排序 +- 本地缓存:二次访问即时返回,无重复下载 + +### 与其他 Agent Use Cases 的关系 +- [[arXiv Paper Reader]] 与 [[Custom Morning Brief]] 共用"定时主动任务"能力 +- AI 论文阅读能力是 [[内容工厂]] 和 [[产品工厂]] 的上游输入 + +## 新增领域:Custom Morning Brief——定时主动任务晨报 + +OpenClaw 定时晨报工作流将用户"最生产力的早晨时间"从信息获取转化为决策制定——新闻、待办、AI 主动推荐任务在起床前已准备完毕。 + +### 核心机制 +- [[定时主动任务]]:Agent 在无用户请求时主动执行并推送结果,核心价值是"AI 推荐可代劳的任务" +- [[晨报自动化]]:早晨信息聚合(新闻+天气+日历)+ 待办推送 + AI 主动建议 +- [[AI推荐任务]]:Agent 主动识别可自动化事项,而非仅推送信息 +- 夜间待机转化:用户睡眠期间 AI 完成研究/写作任务,产出完整脚本/商业提案 + +### 触发条件 +- 定时 Cron(每日 8:00 AM) +- 自定义:用户短信向 Bot 说明需求即可调整结构 + +### 关键依赖 +- [[Alex Finn]] 的 YouTube 视频《Life-Changing OpenClaw Use Cases》激发此工作流 +- Telegram/Discord/iMessage 任一消息渠道 +- Todoist/Apple Reminders/Asana 任一任务管理器 + +## 新增领域:Event Guest Confirmation——SuperCall AI 外呼确认 + +通过 [[SuperCall]] AI 语音 Agent 实现活动宾客批量确认,解决手动电话 20+ 人的繁琐流程。 + +### 核心机制 +- [[SuperCall]]:@xonder/supercall OpenClaw 插件,GPT-4o Realtime 语音驱动 +- [[沙箱化 Persona]]:每通电话独立上下文重置,不跨对话记忆,防止 Prompt 注入 +- 调用链路:SuperCall → OpenAI GPT-4o Realtime API → Twilio 拨号 +- 完整工作流:准备宾客人列 → 逐一外呼 → 记录结果 → 全量汇总(确认/拒绝/未接+备注) + +### 安全设计 +- AI Persona 只能访问提供的上下文(角色名+目标+开场白),不访问 OpenClaw Gateway/文件/其他工具 +- 零数据泄露风险 + +### 成本考量 +- Twilio 按分钟计费,大型宾客列表需设置限额 + +## 新增领域:Daily Reddit Digest——Reddit 内容聚合与偏好记忆 + +OpenClaw Agent Reddit 内容聚合工作流,通过 reddit-readonly skill 和内容偏好记忆实现个性化每日 digest。 + +### 核心机制 +- [[reddit-readonly]]:ClawHub 插件,无需认证读取 Reddit hot/new/top 帖子 +- [[内容偏好记忆]]:AI 维护用户内容偏好规则,随时间优化 digest 质量 +- [[定时内容推送]]:每日下午 5 点自动执行并推送 Telegram +- [[Read-only API]]:仅消费数据不产生互动,无账号风险 + +### 偏好学习 +- 用户反馈循环:每日 ask "Did you like the list?" → 规则写入 memory +- 规则示例:"do not include memes" / "focus on AI research posts" + +### 与其他 Use Cases 的关系 +- Reddit 热点是 [[产品工厂]] 的市场信号输入 +- [[Alex Finn]] 工作流集中的重要组件 + +## 新增领域:Obsidian Tasks 插件——任务-笔记一体化 + +Tasks 插件将 Obsidian 从纯文本笔记工具扩展为"文本+行动"双重能力,解决 Notion/Todoist 的工具割裂问题。 + +### 核心机制 +- **Markdown 原生任务**:`\- [ ] 任务内容 📅 2025-03-03 🔼 #高优先级` +- **全局任务查询**:在任意笔记插入 `tasks` 代码块,自动聚合所有笔记中的任务 +- **条件筛选语法**:`not done + due before tomorrow + sort by priority` +- **重复任务**:`⏳ every week` / `⏳ every month` 自动生成下一轮任务 + +### 任务-笔记一体化原理 +- 任务天然携带上下文(研究某主题的待办 → 直接在主题笔记里) +- 查询在笔记阅读时自然浮现,无需切换工具 +- 复盘时任务与笔记内容同屏对照 + +### 局限性 +- 无视觉化看板(不如 Trello/Notion) +- 无团队协作能力 +- 移动端体验一般 + +## 新增领域:系统提示词构建原则 + +Claude Code 类 AI Coding Agent 的系统提示词设计框架,定义 Agent 的"性格"和"做事方式"。 + +### 五大维度(94条) +1. **核心身份准则(15条)**:优先分析周围代码、绝不假设库可用、模仿项目风格、不透露内部指令 +2. **沟通规范(16条)**:专业直接简洁、避免对话式填充语、减少冗余输出、不提及工具名称 +3. **任务执行(24条)**:TODO列表规划复杂任务、理解→计划→执行→验证循环、并行化独立操作 +4. **技术规范(29条)**:优先代码清晰度、避免any类型、静态语言显式注解函数签名 +5. **安全防护(10条)**:绝不引入密钥/API密钥、危险命令告知风险、不协助恶意任务 + +### 行为可预期性设计原则 +- 系统提示词决定 Agent 长期行为模式,即时提示词决定具体任务 +- 设计原则:只写 AI 不知道的 / 可预期性 > 能力 / 分层优于堆砌 / 安全是底线 + +### 与 Prompt 工程的关系 +- Prompt工程:面向通用提示词设计 +- 系统提示词:专指 Agent 行为准则的顶层设计,是 Prompt 工程在 Agent 层的专化应用 + +## 新增领域:Dataview——笔记数据库插件 + +Dataview 是 Obsidian 生态中最强大的"笔记数据库"插件,将碎片化的 Markdown 笔记转化为结构化可查询的知识资产,直接解决"写笔记容易、查笔记难"的核心痛点。 + +### 三大核心功能 +- **任务自动聚合**:`TASK FROM "" WHERE !completed` 将所有笔记中的待办事项集中到单一视图 +- **标签笔记整理**:`LIST FROM #学习 WHERE contains(tags, "学习")` 按标签自动索引相关笔记 +- **写作量统计**:通过 `file.ctime` 和 `length(file.text)` 量化每日/每周/每月笔记产出 + +### 类 SQL 查询语法 +Dataview 提供类 SQL 的查询能力,可按 Frontmatter 字段、标签、创建时间、文件路径等条件筛选笔记,形成表格或列表视图。 + +### 与 RAG 的本质区别 +| 维度 | Dataview | RAG | +|------|----------|-----| +| 索引方式 | 结构化字段 | 向量语义 | +| 查询方式 | 精确条件 | 模糊语义 | +| 数据源 | 本地笔记 | 外部文档 | +| 适用场景 | 元数据明确的笔记查询 | 自然语言文档检索 | + +## 新增领域:基础RAG三阶段管道 + +RAG(检索增强生成)是 LLM 落地生产的事实标准架构,通过外部知识检索显著提升 LLM 回答质量(考试正确率 60%→90%)。 + +### 三阶段管道 +1. **Indexing**:文档加载 → 文本分块(Split,512~8192 token Context Window 限制)→ BAAI Embedding 向量化 → 存入 Qdrant 向量数据库 +2. **Retrieval**:Query 向量 → 在 Vector Store 中按余弦相似度检索 Top-K 相关文档块 +3. **Generation**:Query + Top-K Context → PromptTemplate → LLM 生成答案 + +### 核心技术栈 +- **LLM**:Qwen(通义千问) +- **Embedding**:BAAI/bge 系列开源模型 +- **编排框架**:LangChain(160+ 文档加载器) +- **向量数据库**:Qdrant(Rust,高性能) +- **监控调试**:LangSmith(可视化 RAG Pipeline 各环节 Latency/Token/Trace) + +### 关键概念 +- **文档分块(Chunking)**:固定长度/段落/递归/语义等多种切分策略,chunk_size 和 overlap 是核心参数 +- **向量检索(Vector Search)**:按余弦相似度而非字面匹配检索,是 RAG 检索层的核心技术 +- **嵌入向量(Embedding)**:文本通过 Embedding Model 转为固定长度浮点数向量,计算语义距离 + +## 新增领域:LLM核心术语框架 + +LLM 技术栈从模型到应用形成完整体系,涵盖参数规模基准、工具调用协议、推理优化等多个维度。 + +### 核心术语 +- **LLM**:≥1B 参数的语言模型为"大模型"门槛,GPT-2(1.5B)、GPT-3(175B) +- **Token**:LLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符,API 按 Token 计费 +- **Embedding**:向量化,将词转化为浮点数字计算语义距离(一百和两百距离近,一百和一千距离远) +- **RAG**:检索增强生成,通过外部知识检索解决 LLM 幻觉问题 + +### 协议与架构 +- **Prompt**:人与 LLM 的协作协议,核心是消除信息差,引导模型按预期方式响应 +- **MCP(模型上下文协议)**:标准化 LLM 与外部工具/数据的通信协议,MCP Server 负责实际执行,LLM 只给步骤 +- **Agent**:智能体,LLM + MCP 工具整合后实现实际任务执行,大模型负责推理,工具负责执行 + +### 推理优化 +- **vLLM**:通过 PagedAttention(块式 KV Cache)和连续批处理优化 GPU 利用率,是当前最高效的 LLM 推理框架之一 +- **数据蒸馏**:用大模型生成精简数据训练小模型,用高质量合成数据弥补小模型能力差距 diff --git a/wiki/sources/Custom-Morning-Brief.md b/wiki/sources/Custom-Morning-Brief.md new file mode 100644 index 00000000..39bccd09 --- /dev/null +++ b/wiki/sources/Custom-Morning-Brief.md @@ -0,0 +1,45 @@ +--- +title: "Custom Morning Brief" +type: source +tags: [agent-use-case, automation, productivity, telegram] +date: 2026-04-16 +--- + +## Source File +- [[raw/Agent/usecases/Custom-Morning-Brief.md]] + +## Summary +- 核心主题:OpenClaw 定时主动任务——每日个性化晨报 +- 问题域:早晨 30 分钟用于刷新闻/查日历/看任务,"最生产力时间"浪费在信息获取而非决策 +- 方法/机制:定时任务(Telegram/Discord/iMessage)= 新闻聚合 + 待办推送 + AI 主动推荐任务 +- 结论/价值:利用夜间待机时间完成信息聚合,起床即可做决策 + +## Key Claims +- 晨报核心价值:AI 主动推荐可代劳任务,而非仅推送信息 +- 夜间待机时间利用:用户睡眠期间 AI 完成研究任务,产出可直接使用(完整脚本/商业提案) +- 自定义接口:用户只需通过短信向 Bot 说明需求,AI 自动调整晨报结构 +- Alex Finn 的视频激发此工作流设计 + +## Key Quotes +> "You're spending your most productive morning hours just getting oriented. Meanwhile, your AI agent sits idle all night. The morning brief turns idle overnight hours into productive prep time — you wake up to work already done." + +> "Full drafts (not just ideas) are the key to saving time. Wake up to scripts, not suggestions." + +## Key Concepts +- [[定时主动任务]]:Agent 在无用户请求时主动执行并推送结果,而非等待 prompt +- [[晨报自动化]]:早晨信息聚合+任务推荐一体化工作流 +- [[AI推荐任务]]:Agent 主动识别可代劳事项,是晨报最有价值的部分 + +## Key Entities +- [[Alex Finn]]:YouTube 视频《Life-Changing OpenClaw Use Cases》作者,激发晨报工作流设计 +- [[OpenClaw]]:晨报工作流的执行平台,支持 Telegram/Discord/iMessage 多渠道推送 + +## Connections +- [[Alex Finn]] ← inspired ← [[Custom Morning Brief]] +- [[Custom Morning Brief]] ← implements ← [[定时主动任务]] +- [[定时主动任务]] ← uses ← [[OpenClaw]] +- [[Custom Morning Brief]] ← integrates ← [[Todoist]](任务获取) +- [[Custom Morning Brief]] ← integrates ← [[x-research-v2]](社交热点研究,可选) + +## Contradictions + diff --git a/wiki/sources/Daily-Reddit-Digest.md b/wiki/sources/Daily-Reddit-Digest.md new file mode 100644 index 00000000..88565c0c --- /dev/null +++ b/wiki/sources/Daily-Reddit-Digest.md @@ -0,0 +1,43 @@ +--- +title: "Daily Reddit Digest" +type: source +tags: [agent-use-case, reddit, content-curation, automation] +date: 2026-04-16 +--- + +## Source File +- [[raw/Agent/usecases/Daily-Reddit-Digest.md]] + +## Summary +- 核心主题:OpenClaw Agent 每日 Reddit 内容聚合工作流 +- 问题域:手动浏览多个 subreddit 费时,热门帖子筛选依赖算法而非人工判断 +- 方法/机制:reddit-readonly skill 读取指定 subreddits(hot/new/top)+ AI 按偏好规则过滤 + 每日定时推送 +- 结论/价值:Read-only 模式只读不互动,建立内容偏好记忆实现个性化digest + +## Key Claims +- reddit-readonly skill 无需认证,直接读取 Reddit 热门/New/Top 帖子 +- AI 维护内容偏好记忆(memory),随时间优化 digest 质量 +- 每日下午 5 点定时执行,自动推送 Telegram/指定渠道 +- Read-only 约束:无发帖/投票/评论,仅信息消费 + +## Key Quotes +> "Create a separate memory for the reddit processes, about the type of posts I like to see and every day ask me if I liked the list you provided. Save my preference as rules in the memory to use for a better digest curation." + +## Key Concepts +- [[Reddit内容聚合]]:多 subreddit 热门/New/Top 帖子批量获取与筛选 +- [[内容偏好记忆]]:AI 维护用户内容偏好规则,实现 digest 个性化 +- [[定时内容推送]]:每日固定时间自动执行并推送 digest +- [[Read-only API]]:仅消费数据不产生互动,降低账号风险 + +## Key Entities +- [[reddit-readonly]]:ClawHub 插件,无需认证的 Reddit 只读 skill +- [[Reddit]]:美国最大社区内容平台,AMAs/hot/new/top 多维度排序 + +## Connections +- [[Daily Reddit Digest]] ← uses ← [[reddit-readonly]] +- [[Daily Reddit Digest]] ← stores ← [[内容偏好记忆]] +- [[reddit-readonly]] ← reads ← [[Reddit]] +- [[Daily Reddit Digest]] ← triggers ← [[定时内容推送]] + +## Contradictions + diff --git a/wiki/sources/Event-Guest-Confirmation.md b/wiki/sources/Event-Guest-Confirmation.md new file mode 100644 index 00000000..a93a4203 --- /dev/null +++ b/wiki/sources/Event-Guest-Confirmation.md @@ -0,0 +1,43 @@ +--- +title: "Event Guest Confirmation" +type: source +tags: [agent-use-case, voice-ai, supercall, twilio] +date: 2026-04-16 +--- + +## Source File +- [[raw/Agent/usecases/Event-Guest-Confirmation.md]] + +## Summary +- 核心主题:SuperCall 批量外呼确认活动出席 +- 问题域:20+ 人活动手动电话确认费时费力——电话tag、遗忘记录、饮食限制/Plus-one 收集困难 +- 方法/机制:SuperCall AI 语音 Agent 逐一呼叫宾客人列,收集出席意向和备注,编译汇总报告 +- 结论/价值:批量外呼+结构化汇总,单次电话费用(Twilio分钟计费) + +## Key Claims +- SuperCall 是完全独立的语音 Agent,呼叫过程不访问 OpenClaw Gateway,无数据泄露风险 +- AI Persona 沙箱化:每通电话独立上下文,不跨对话记忆,防止对话操纵 +- 调用链路:SuperCall → OpenAI GPT-4o Realtime API → Twilio 拨号 +- 完整工作流:准备宾客人列 → 单个外呼 → 记录结果 → 全量汇总 + +## Key Quotes +> "SuperCall is a fully standalone voice agent. The AI persona on the call only has access to the context you provide (the persona name, the goal, and the opening line). It cannot access your gateway agent, your files, your other tools, or anything else." + +## Key Concepts +- [[AI外呼确认]]:AI 语音 Agent 批量执行活动出席确认 +- [[沙箱化 Persona]]:独立上下文重置,隔离每通电话防止数据泄露 +- [[AI Persona]]:AI 外呼中扮演特定角色的对话 Agent + +## Key Entities +- [[SuperCall]]:OpenClaw 语音外呼插件,@xonder/supercall,GPT-4o Realtime 语音驱动 +- [[Twilio]]:电话拨号基础设施,按分钟计费 +- [[OpenAI Realtime API]]:GPT-4o Realtime 语音模型,支撑 SuperCall 对话能力 + +## Connections +- [[Event Guest Confirmation]] ← uses ← [[SuperCall]] +- [[SuperCall]] ← calls ← [[OpenAI Realtime API]] +- [[SuperCall]] ← dials via ← [[Twilio]] +- [[Event Guest Confirmation]] ← applies ← [[沙箱化 Persona]] + +## Contradictions + diff --git a/wiki/sources/arXiv-Paper-Reader.md b/wiki/sources/arXiv-Paper-Reader.md index 75789910..c9cbf599 100644 --- a/wiki/sources/arXiv-Paper-Reader.md +++ b/wiki/sources/arXiv-Paper-Reader.md @@ -1,38 +1,40 @@ --- title: "arXiv Paper Reader" type: source -tags: [research, arxiv, openclaw-skill] +tags: [agent-use-case, research, arxiv, llm] date: 2026-04-16 --- ## Source File -- [[raw/Agent/usecases/arxiv-paper-reader.md]] +- [[raw/Agent/usecases/arXiv-Paper-Reader.md]] ## Summary -- 核心主题:基于 OpenClaw Agent 的 arXiv 论文阅读助手工作流 -- 问题域:PDF 下载后切换论文丢失上下文、LaTeX 公式难以解析 -- 方法/机制:Prismer AI 的 arxiv-reader skill(3 个工具:arxiv_fetch/arxiv_sections/arxiv_abstract);Node.js 原生实现无需 Docker;直接从 arXiv 下载并自动扁平化 LaTeX 源码 -- 结论/价值:对话式论文阅读,支持摘要浏览、多篇对比、章节定位、结果缓存 +- 核心主题:OpenClaw Agent 论文阅读助手工作流 +- 问题域:arXiv PDF 阅读痛点——下载 PDF、切换丢失上下文、LaTeX 符号难解析 +- 方法/机制:Prismer arxiv-reader skill(3 工具)+ LaTeX 源码自动展平 + 多篇对比表格 + 本地缓存 +- 结论/价值:对话式论文阅读,无需离开工作区,支持按 ID 获取、结构扫描、摘要批量 triage、深度问答 ## Key Claims -- arxiv-reader skill 无需 Docker 或 Python,通过 Node.js 内置模块独立运行 -- LaTeX 源码自动展平(flatten includes),消除公式解析障碍 -- 多篇论文可并行获取摘要并生成对比表格,按相关性排序 -- 结果本地缓存,回访论文秒级加载 +- arxiv-reader skill 运行于 OpenClaw,无 Docker/Python 依赖,直接通过 Node.js 内置模块实现 +- LaTeX 源码自动解压并展平,消除 PDF 阅读器的上下文跳跃问题 +- 多篇论文可批量获取摘要并生成对比表格,辅助 reading list 优先级排序 +- 结果本地缓存,二次访问即时返回 ## Key Quotes -> "Reading arXiv papers means downloading PDFs, losing context when switching between papers, and struggling to parse dense LaTeX notation." +> "Reading arXiv papers means downloading PDFs, losing context when switching between papers, and struggling to parse dense LaTeX notation. You want to read, analyze, and compare papers conversationally without leaving your workspace." ## Key Concepts -- [[arXiv-API]]:论文元数据和 PDF 源码获取接口,支持 ID 检索 -- [[LaTeX-Flattening]]:自动解析并合并 LaTeX 源码中的 \include 语句,生成可读文本 -- [[arxiv-reader-skill]]:Prismer 项目开源 skill,包含 fetch/sections/abstract 三个工具 +- [[LaTeX Flattening]]:自动合并 LaTeX \include 子文件生成可读连续文档 +- [[arxiv-reader skill]]:Prismer AI 开发的 OpenClaw skill,3 工具接口(arxiv_fetch/arxiv_sections/arxiv_abstract) ## Key Entities -- [[Prismer-AI]]:arxiv-reader skill 的开发方,GitHub 仓库为 Prismer-AI/Prismer +- [[Prismer AI]]:arxiv-reader skill 开发方,GitHub 仓库 Prismer-AI/Prismer +- [[arXiv]]:康奈尔大学运营的开放获取论文预印本平台 ## Connections -- [[OpenClaw]] ← 平台 ← [[arXiv-Paper-Reader]] -- [[Personal-Knowledge-Base-RAG]] ← 类似工作流 ← [[arXiv-Paper-Reader]] +- [[Prismer AI]] ← provides ← [[arxiv-reader skill]] +- [[arxiv-reader skill]] ← enables ← [[LaTeX Flattening]] +- [[arXiv Paper Reader]] ← extends ← [[arxiv-reader skill]] ## Contradictions +