67 KiB
LLM Wiki Overview
核心主题
AI开源生态在2025年取得突破性进展,国产模型在多个领域成为国际闭源产品的有力替代。同时,DevOps 文化与转型方法论为组织提供数字化交付能力建设的系统性指导。
主要领域
- 本地AI推理:Ollama + Qwen2.5-Coder 7B 在 Ubuntu 服务器快速部署本地 LLM 推理能力,GPU 自动加速,远程 API 供 n8n/OpenClaw 调用
- NAS 存储架构:Synology NAS NFS 永久挂载方案,rsync 增量备份保留 Docker 卷权限信息
- AI生图:Flux和Stable Diffusion主导开源生态,Flux在人体解剖学正确性上表现最佳
- AI生视频:HunyuanVideo以最大参数量成为开源视频生成标杆
- 通用智能体:Manus定义AI Agent元年,OpenManus提供开源实现
- AI编程:Cline将VS Code变身全自动AI工程师
- 智能体工作流:n8n(16万Star)和Dify实现可视化AI流程编排
- AI搜索:Perplexica实现完全本地化的开源搜索
- DevOps 文化与转型:四大支柱驱动组织数字化交付能力
- DevOps 成熟度评估:DORA 四指标 + 云成熟度 5 级模型
- Linux 运维:150 个核心命令覆盖系统管理全场景
- OpenClaw Agent Use Cases:arXiv 论文阅读(LaTeX 自动展平)/自主游戏开发(Bugs First + 每7分钟产出)/语义记忆搜索(memsearch 混合向量)/自愈基础设施(SSH+Cron+多因素安全)/预测市场自动化(纸带交易策略)
关键趋势
- 深度推理让AI学会"慢思考"
- 开源内卷将价格打成白菜价
- 国产开源模型在多个领域实现差异化竞争
- DevOps 向 GitOps、AI 赋能、Serverless 和 Edge Computing 方向演进
新增领域:Agent Use Cases 四大工作流
1. Autonomous Project Management(去中心化项目管理)
基于 STATE.yaml 的去中心化协调模式,替代传统中央 orchestrator。subagent 通过读写共享状态文件自主协作,Git 作为审计日志,主会话保持薄(CEO 模式)。灵感来源:Nicholas Carlini。
2. Content Factory(内容工厂)
Discord 多 agent 链式协作管线:Research Agent 扫描趋势 → Writing Agent 生成脚本 → Thumbnail Agent 生成配图,全部自动执行定时运行。Alex Finn YouTube 视频激发此工作流设计。
3. Market Research & Product Factory(产品工厂)
Last30Days 挖掘 Reddit/X 真实用户痛点 → ranked pain points → OpenClaw 构建 MVP。零编码要求,每周定时追踪市场演变。核心依赖:Matt Van Horne 的 Last30Days skill。
4. Personal Knowledge Base RAG(个人知识库)
基于 RAG 的第二大脑:Drop any URL 自动摄取 → 向量嵌入 → 语义搜索返回 ranked 结果+来源引文。支持其他 agent 工作流主动查询。
新增领域:Claude Skills 与流程工程
Claude Skills 的爆发标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP,将人类经验封装为可复用工作流。Anthropic 官方 Skills 仓库(github.com/anthropics/skills)收藏数突破 3.2 万,包含生产级 Skills:办公自动化、开发者工具箱、创意类 Skill。Vibe Coding 的尽头也是 Skills。
关键概念
资源生态
- 三大 Awesome 仓库:ComposioHQ、VoltAgent、BehiSecc
- 三大聚合站:skillsmp.com、aitmpl.com、claudemarketplaces.com
新增领域:NotebookLM 与 Source-Grounding
NotebookLM 通过 Source-Grounding 机制(严格限制知识库仅含上传文档)实现高精度回答,每个答案附带精确引文。可作为被动学习(Audio Overviews)、项目管理、法律文档审查、软件更新对比等多种场景的 AI 助理。
关键能力
- Source Grounding:消除幻觉,确保回答可溯源
- 被动学习:Audio Overviews 在碎片时间消费复杂信息
- 引文追溯:每个回答附带原文引文
新增领域:AI图生视频
2025年底,AI图生视频技术快速成熟,14款免费工具已能生成高质量视频,覆盖电商模特、内容创作、广告制作等多场景。
主要产品
- 绘蛙AI视频(阿里巴巴):模特图转视频,操作简便
- 智谱清影(智谱AI):30秒生成6秒高清视频,支持风格选择
- Vidu(生数科技+清华大学):全球首个"多主体参考"功能
- 可灵AI(快手):3D时空联合注意力,物理逻辑动作生成
- 海螺AI(MiniMax):主体一致性保持,光影色调高度一致
- Stable Video(Stability AI):LoRA摄像机精细控制
关键能力
新增领域:DevOps 文化与转型
核心框架
DevOps 建立在四大支柱之上:协作优先于孤岛、自动化即赋能者、持续改进(Kaizen)、客户中心。
关键实践
- CI/CD Pipelines:自动化构建、测试、部署流水线(Jenkins、GitHub Actions、GitLab CI)
- Infrastructure as Code:以代码管理基础设施(Terraform、AWS CloudFormation)
- DevSecOps:在 CI/CD 中内置安全(SonarQube、Snyk)
- GitOps:以 Git 为单一真实源管理配置
工具生态
- 监控可观测性:Prometheus、Grafana、Datadog
- 容器化:Docker、Kubernetes
- 配置管理:Ansible(Red Hat)
未来趋势
- AI/ML 赋能 DevOps(代码审查智能自动化、异常检测、自愈基础设施)
- Serverless DevOps:FaaS 减少运维开销
- Edge Computing DevOps:边缘节点实时应用优化
新增领域:DevOps 成熟度与云成熟度评估
DevOps 成熟度模型
DevOps 成熟度评估帮助组织了解当前效能水平并识别改进方向,核心框架为 Google DORA 团队提出的四指标体系。
DORA 四指标
- DORA指标:部署频率、变更前置时间、变更失败率、平均恢复时间
- 精英团队:每天多次部署、变更前置时间 < 1 天、变更失败率 0-15%、MTTR < 1 小时
- 关联概念:Kaizen、Chaos Engineering(主动测试系统韧性)
云成熟度 5 级模型
- Level 0(Legacy):无云准备,纯本地遗留系统
- Level 1(Initial):初始准备,少数系统试点云服务
- Level 2(Repeatable):可重复,建立流程和采购规范
- Level 3(Systematic):系统化文档化,有管理流程和合规策略
- Level 4(Measured):可测量,云原生应用广泛采用
- Level 5(Optimized):优化,数据驱动决策,灵活跨云迁移工作负载
三要素评估
- People:技能与工作方式转型
- Processes:工作流优化
- Technology:基础设施适配
Forrester 预测
2025 年全球云成熟度模型市场达 15 亿美元,60%+ 组织已实施云成熟度模型。
新增领域:Linux 运维 150 命令
Linux 命令是系统管理的核心,核心理念为"一切皆文件"——CPU、内存、磁盘、键盘、鼠标、用户都是文件。
命令分类
- 线上查询:man(命令帮助)、help(内置命令帮助)
- 文件目录操作:ls/cd/cp/find/mkdir/mv/pwd/rename/rm/rmdir/touch/tree/basename/dirname/chattr/lsattr/file/md5sum
- 文件内容处理:cat/tac/more/less/head/tail/cut/split/paste/sort/uniq/wc/iconv/dos2unix/diff/vimdiff/rev/grep/join/tr/vi/vim
- 压缩解压:tar/unzip/gzip/zip
- 信息显示:uname/hostname/dmesg/uptime/stat/du/df/top/free
关键概念
新增领域:家庭多节点混合基础设施
基于四层混合架构(VPS1 公网入口 + MacMini 主控 + Synology NAS 媒体存储 + Ubuntu1/2 应用节点),通过 FRP 内网穿透和 Caddy 反向代理实现全服务统一公网访问。
节点角色
- VPS1:公网入口,FRPS 监听 7000 端口 + Caddy HTTPS 反向代理,所有内网服务通过 FRP 隧道暴露
- Mac Mini:OpenClaw 主控节点,stq 项目栈(n8n/mariadb),vaultwarden 密码管理
- Synology NAS DS718:媒体平台(Jellyfin/Navidrome/Calibre)、对象存储(MinIO/Zipline)、Docker 监控栈
- Ubuntu1:监控全家桶(Grafana/Prometheus/Alertmanager/blackbox/cAdvisor)、homarr 导航面板、superset BI
- Ubuntu2:n8n 工作流引擎、Gitea 版本控制、drawio 图表编辑器
关键架构
- FRP内网穿透:frpc+frps 架构,MacMini/NAS/Ubuntu1/2 均运行 frpc 连接 VPS1 frps
- 反向代理:Caddy(VPS1)统一申请 Let's Encrypt 证书,按域名路由;nginx-proxy-manager(Ubuntu1)管理内部 HTTPS
- 多节点基础设施:四层拓扑通过内网 192.168.3.0/24 互联,VPS1 FRPS 端口 7000 是唯一公网入口
- 可观测性:Prometheus + Grafana + Alertmanager + blackbox_exporter 覆盖所有节点
科学上网状态
- macmini/ubuntu1/ubuntu2:socks5://127.0.0.1:10808 ✅ 正常
- NAS:socks5://127.0.0.1:20170 ❌ 仅本机监听
新增领域:Jellyfin 开源媒体服务器
Jellyfin 是 Plex 的 GNU GPL 开源分支,提供完全自托管的媒体服务器能力,支持电影/电视剧/音乐/有声书,自动从 TMDB/TVDB 刮削元数据。
部署配置
- 镜像:nyanmisaka/jellyfin(优化版,内置 Intel QuickSync 支持)
- 硬件转码:通过 /dev/dri 挂载 Intel GPU,将 H.265/H.264 转码卸载到 QuickSync,CPU 占用从 300%+ 降至 <20%
- 存储:/volume2/movie + /volume1/TV shows 以只读 :ro 挂载防止误改
- 用户权限:user: "1026:100" 匹配群晖默认 UID/GID
关键概念
新增领域:Vibe Coding 工程化实践
超越提示词优化,进入工程化实践阶段。vibe-coding经验收集 收集了 X/Twitter 实践者的核心工作流。
核心工程化模式
- 设计文档优先:需求 → 含伪代码的设计文档 → AI 直出代码,比纯提示词显著提高直出质量
- 双AI-Review:第一个 AI 生成 + 第二个 AI 独立 review,避免 self-justification,人工保留最终决策权
- 上下文压缩:CodeWeaver 将屎山代码库编织为树形 Markdown,解决 AI 上下文窗口限制
趋势判断
"未来的软件工程核心不是'看懂代码',而是'验证代码按正确逻辑运行'" — 通过自动化测试+静态分析+形式化验证取代"看代码理解"
新工具
- CodeWeaver:GitHub 工具,将任意项目编织为可导航 Markdown,简化 AI 上下文注入
新增领域:Nano Banana 结构化提示词框架
Google Nano Banana 是图像生成提示词的结构化框架,通过 9 个标准化字段(Shot/Subject/Environment/Lighting/Camera/ColorGrade/Style/Quality/Negatives)将创意描述转化为机器可执行参数。
关键机制
- negatives(负向提示词)是质量控制关键字段
- camera 字段提供电影级构图控制(焦距/光圈/角度)
- 物件描述框架与人物描述框架共用同一结构,subject 字段内容不同
关键概念
- Nano Banana:Google 发布的结构化图像提示词框架
- 负向提示词:明确排除不需要的特征
新增领域:Claude + n8n-mcp AI 工作流自动生成
Claude 与 n8n-mcp 结合,通过自然语言直接生成 n8n 工作流,降低自动化门槛。
核心机制
- n8n mcp:提供 543 个 n8n 节点的结构化访问,271 个 AI 能力节点
- Claude 自动生成工作流完成度约 80%-90%,10%-20% 错误率需人工修正
- 选择 Opensea 模型并开启 extended thinking 可显著提升生成质量
关键能力
新增领域:MCP 在 Cursor 中的集成
MCP 协议为 Cursor 提供与大模型外围服务的高效集成能力。
核心机制
- MCP:Client-Server 架构,3 种接口(资源读取/工具调用/Promise 提示词)
- Composer:Cursor 对话模块,支持 Agent 模式和 Normal 模式
- Agent模式:自动执行 MCP 工具链,减少手动操作
- Sequential Thinking:逻辑推理分步工具,提升 AI 决策质量
关键区分
- Agent 模式:工具链自动串联
- Normal 模式:需手动复制命令
- enable yolo mode:风险高,默认关闭
新增领域:Google 5 种 Agent Skill 设计模式
Google Cloud 发布的 Skill 内容结构化设计模式,解决 SKILL.md 格式标准化后执行效果差异大的问题。
5 种模式
- Tool Wrapper:监听关键词动态加载规范文档,适合团队编码规范分发
- Generator:通过"填空"流程强制一致输出格式
- Reviewer:分离检查清单与检查逻辑,换清单即换审计类型
- Inversion:agent 先问你再做,逐阶段收集信息
- Pipeline:带硬性检查点的严格顺序工作流
Anthropic 补充
- 最好的 Skill = 工具箱,而非"写好的提示词"
- 写 Skill 三条铁律:只写 Agent 不知道的、重点写踩坑清单、给工具不给指令
- 5 种模式可组合(Pipeline 包含 Reviewer、Generator 依赖 Inversion)
关键能力
- 渐进式披露:ADK 机制,agent 只在需要时才加载特定 token
新增领域:Claude Code 调用模式
OpenClaw/Hermes 通过 terminal 工具调用 Claude Code,两种核心模式满足不同场景需求。
关键机制
- Print Mode:stdin 管道非交互模式,适合绝大多数编程任务
- TMUX交互模式:tmux session 交互模式,适合超长任务
--permission-mode bypassPermissions跳过所有交互确认,是自动化调用的必要条件--add-dir自动扫描 SKILL.md 并在触发条件匹配时激活
关键区分
- delegate_task 仅调用 Hermes 子 agent,无法建立 Claude Code CLI 通道
- Skill 调用必须使用 terminal + claude -p
新增领域:baoyu-skills Claude Code 技能集
宝玉发布的 Claude Code 技能集,通过 ClawHub 协议支持按单个 skill 安装,涵盖内容生成、AI 图像创作、日常效率工具三大类。
技能架构
- 内容技能:baoyu-xhs-images(小红书9×6风格布局)、baoyu-infographic(20×17布局风格)、baoyu-cover-image(5维封面定制)、baoyu-slide-deck(4维度16预设)、baoyu-comic(5×8画风基调)、baoyu-article-illustrator
- baoyu-imagine:9 家服务商自动选择(OpenAI/Google/DashScope/MiniMax/即梦/豆包/Replicate等)
- 工具技能:baoyu-translate(三模式翻译)、baoyu-youtube-transcript、baoyu-url-to-markdown
发布协议
- ClawHub 按单个 skill 安装(clawhub install baoyu-imagine),而非 marketplace 批量安装
- EXTEND.md 支持用户级/项目级自定义,Env 配置支持 API Key 优先级覆盖
新增领域:AI 产品经理工作流
AI 时代产品经理将 Gemini 深度嵌入需求文档、FeatureList、逻辑图、HTML 原型的全链路工作流。
核心方法
- FeatureList 共创:与 Gemini 构思需求框架,AI 补全层级和边界场景
- PRD自动生成:分页面逐一描述 + PRD 写作指南模板 + 调教反馈
- Mermaid 代码生成 ER 图、泳道图、甘特图(飞书原生支持)
- HTML 原型同步生成 + 差量维护 = 永远最新的交互原型库
核心洞察
- Gemini = 知识渊博但不带脑子的苦工,表述越准执行越准
- 超级个体 = 某领域八九十分 + AI 横向扩展,AI 是充分非必要条件
- 市场洞察力 = 产品经理最稀缺也最重要的能力,AI 时代更重要
新增领域:递归自优化生成系统的形式化框架
tuuai 提出的自递归优化生成系统,将 AI 自我改进机制纳入固定点语义与 λ-calculus 的数学框架。
核心机制
- α-提示词(生成器 G)→ Ω-提示词(优化器 O)→ 元生成器(M)→ 自映射 Φ(G) = M(G, O(G(I), Ω))
- 稳定生成能力 = Φ 的固定点 G*:Φ(G*) = G*
- 自举(Bootstrapping):用优化产物反馈给系统,启动下一轮进化
- Y Combinator 表达:G* = Y STEP,满足 G* = STEP G*
关键命题
- 自优化的目标不是单次最优输出,而是生成器空间 {G_n} 的收敛行为
- 固定点 对应系统不动点,即自洽的稳定生成能力
- 自递归优化生成系统 与 Agent Skill Generator Pattern 形成理论与实践的对应
新增领域:LLM 核心术语与技术框架
LLM 技术栈从模型到应用形成完整体系,涵盖参数规模基准、工具调用协议、推理优化等多个维度。
核心概念
- LLM:≥1B 参数的语言模型为"大模型"门槛,GPT-2(1.5B)、GPT-3(175B)
- MCP:Model Context Protocol,LLM 与外部工具的标准化通信协议
- Agent:大模型 + MCP 工具整合后实现实际任务执行,大模型仅输出步骤,执行需依赖 MCP
- RAG:Retrieval-augmented generation,通过检索增强解决幻觉问题(考试正确率 60%→90%)
- Embedding:向量化,将词转化为浮点数字计算语义距离
- vLLM:通过 PagedAttention(块式 KV Cache)和连续批处理优化 GPU 利用率
- Token:LLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符
- 数据蒸馏:用大模型生成精简数据训练小模型
关键洞察
- MCP 协议核心约束:大模型不执行实际调用,只给出步骤建议
- vLLM 推理优化:PagedAttention 避免内存碎片化,连续批处理减少头阻塞
新增领域:Vibe Coding 氛围编程
Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行,让想法到可维护代码成为可审计流水线。
核心方法论
- 开发者从"写代码的人"转变为"指挥 AI 写代码的导演"
- 保持对产品逻辑、用户流程、审美和交互的"感觉"
- 规划是一切:技术选型、实施规划、模块化设计
- AI 工具(Cursor、Windsurf、Trae)承担体力活
推荐资源
- vibe coding cn:中文开发者 Vibe Coding 资源库与工作站
- Cursor + claude-opus-4.5-xhigh 为推荐工具组合
新增领域:Agentic AI 赋能 Cloud DevOps
Agentic AI 将传统响应式 DevOps 转变为预测性、自动化运维。
七大应用场景
- 自主检测与修复:K8s、数据库、存储异常自动修复(MTTR 降低)
- 智能 IaC 管理:审查 Terraform、CloudFormation、Pulumi 脚本
- 成本优化:动态扩展、Spot/Reserved 实例优化(夜间负载转移降低 40% 成本)
- 安全合规:IAM 策略扫描、容器漏洞检测、实时修复
- 日志分析与可观测性:AI 驱动的根因分析
- 多租户 SaaS 管理:自动化创建、配置、归档租户
- AI 增强决策:What-If 模拟、异常检测
关键能力
- Self-Healing Systems:自愈系统,异常检测 + 自动修复
- Multi-Cloud Governance:跨 AWS/GCP/Azure 多云治理
新增领域:OpenClaw Workspace 架构
OpenClaw workspace 文件体系通过 7 个核心文件实现 Agent 的可预期性和一致性。
核心文件
- AGENTS.md:岗位职责说明书(300-500 字最佳),定义边界而非仅列能力
- SOUL.md:性格档案(叙事性角色设定),与 IDENTITY.md 分工明确
- USER.md:用户偏好固化,减少重复交代
- TOOLS.md:工具权限规范,核心是"什么时候不用"
- IDENTITY.md:结构化身份元数据(Name/Creature/Vibe/Emoji/Avatar)
- BOOTSTRAP.md:一次性初始化引导,完成后删除
- 长期记忆:memory/ 目录,Agent 跨会话保留重要信息
核心价值
从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。
新增领域:家庭监控方案(可观测性实践)
家庭和小型实验室场景下,通过 Docker 一键部署完整监控栈,实现主机/容器/服务三层覆盖。
核心组件
- Prometheus:时序数据库和告警规则引擎,pull 模式采集所有 exporter 指标
- Grafana:仪表盘可视化,Dashboard ID 1860/14282/7587 覆盖主要监控需求
- cAdvisor:容器指标采集,挂载 /var/lib/docker/ 获取完整容器资源数据
- blackbox_exporter:HTTP/TCP/DNS/TLS 黑盒探测,监控内外网服务可用性
- node_exporter:主机指标采集,CPU/内存/磁盘/网络
- Alertmanager:告警分组抑制分发,支持邮件/Slack/Telegram
关键告警
- HostHighCPU:CPU 5分钟平均 > 85%
- HostLowDisk:磁盘剩余 < 10%
- TLSCertExpiring:证书到期 < 14天
- HTTPProbeFailed:探测连续失败
扩展路径
- Loki + Promtail:日志聚合
- Uptime Kuma:轻量合成探针 UI
- VictoriaMetrics:长期时序存储
关键洞察
- Docker Socket 挂载存在安全风险,容器可获宿主机 root 等同权限
- 监控流量建议放在管理 VLAN 或防火墙限定访问
新增领域:Synology NAS 影视媒体平台
群晖 NAS 作为自托管媒体中心,整合阿里云盘资源与 Plex 前端,构建私有影视平台。
核心组件
- Plex:跨平台媒体服务器,自动刮削 TMDB/TVDB 元数据,支持转码和多设备播放
- Xiaoya Alist:阿里云盘资源聚合,通过 token 授权转存分享资源到阿里云盘
- CloudDrive2:群晖套件,将阿里云盘挂载为本地文件系统
- Synology NAS:硬件平台,Container Manager(Docker)和套件中心两大应用入口
离线镜像导入
当 Container Manager 无法读取 Docker Hub 时,通过 docker save/docker load 在离线环境迁移镜像。
媒体目录策略
aliyun-movie/ → Plex 电影库 aliyun-tvshows/ → Plex 电视剧库 aliyun-documentory/ → Plex 纪录片库
阿里云盘配置
- refresh_token:通过 alist.nn.ci/tool/aliyundrive/request.html 扫码获取
- token:阿里云盘 App 扫码授权
- 安全原则:仅授权资源目录,不授权备份目录
新增领域:电商数据采集与AI处理自动化
基于 Scrapy + Playwright + n8n + Ollama 构建全链路电商数据采集与 AI 处理管线。
核心架构
- Scrapy:异步结构化抓取,分页调度,支持 JSON/CSV 输出
- Playwright:JS 动态页面渲染,scrapy-playwright 插件集成
- n8n Workflow自动化:Cron 触发 → 执行爬虫 → 读取 JSON → AI 处理 → 存储 → 通知
- Ollama:本地 LLM 推理,http://localhost:11434/api/generate 调用
采集字段
title/price/rating/image_urls/product_url
AI 处理任务
- 内容摘要(30字内)
- 分类(类目/品牌/价格区间)
- 特征提取(品牌、型号、规格)
- 多语言翻译
- 异常检测(异常价格/缺图)
防封策略
- User-Agent 轮换
- 代理池(BrightData/ScraperAPI)
- DOWNLOAD_DELAY + 随机化
扩展路径
- FastAPI 服务层:REST API 暴露给前端/BI
- LangChain + Qdrant:向量语义检索
- Grafana/Metabase:电商趋势可视化
新增领域:Last30Days 与多平台热点聚合
Last30Days 研究过去 30 天内多平台社交热点,生成聚合研究报告,覆盖 Reddit/X/YouTube/TikTok/Instagram/Hacker News/Polymarket/Web 8 大数据源。
核心机制
- 多平台热点聚合:整合 8 个数据源的结构化趋势研究方法,权重分层(Reddit/X > YouTube > Polymarket > TikTok > Instagram > Web)
- 社交信号权重:基于真实互动(upvotes/likes/押注)而非单纯曝光量的热度评估框架
- 对比模式("A vs B")一次返回并排对比研究
- ScrapeCreators API 覆盖 Reddit/TikTok/Instagram(前 100 次免费)
API Keys 配置
- SCRAPECREATORS_API_KEY(必填)
- XAI_API_KEY 或 AUTH_TOKEN+CT0(X 搜索)
- OPENROUTER_API_KEY / TAVILY_API_KEY(Web 搜索备选)
最佳实践
- 测试话题:--quick(8-12 条/来源,2 分钟内)
- 深度研究:--deep(50-70 条 Reddit,40-60 条 X,2-8 分钟)
- 指定 X 账号:--x-handle=账号名(搜索特定人物/品牌帖子)
新增领域:gog CLI 与 Google Workspace CLI
gog CLI 是 macOS 系统通过命令行管理 Google Workspace 的工具,支撑日历/邮件自动化工作流。
核心机制
- Google Workspace CLI:命令行管理 Gmail/Calendar/Drive/Contacts/Docs/Sheets
- OAuth 双层验证:OAuth 凭证(身份认证)+ Google Cloud API Enablement(权限控制)
- 403 accessNotConfigured 错误的根因是 Google Cloud 项目未启用对应 API,而非权限问题
关键使用规范
- 添加测试用户(ishenwei@gmail.com)绕过 Google 第三方应用验证限制
- 启用新 API 后必须重新授权(gog auth revoke && gog auth login)
- export GOG_ACCOUNT=ishenwei@gmail.com 设置默认账号
新增领域:Cursor 2.0 与 AI代码编辑器
Cursor 2.0 是基于 VS Code 的 AI 代码编辑器,通过 Composer模型 和多代理并行机制提升编程效率。
核心机制
- AI代码编辑器:集成 AI 辅助的代码编辑器(Cursor/Windsurf/Trae/Cline),AI 代理 + Diff 审查 + 项目规则
- Composer模型:Cursor 自研 AI 生成模型,生成速度比同类快 4 倍
- 多代理并行:Plan/Agent/Ask 三种模式同时运行不同任务,互不干扰
- Diff审查:逐文件对比 AI 生成代码,强制先测试再确认
三种代理模式
- Plan 模式:AI 规划任务步骤,不修改代码
- Agent 模式:自动串联 MCP 工具链,修改代码
- Ask 模式:仅返回文本答案,不修改代码(最安全)
关键规范
新增领域:n8n Docker 部署与网络代理配置
n8n 自托管工作流引擎通过 Docker 部署在 Ubuntu2(192.168.3.45),通过 SOCKS5 代理解决容器内访问外网问题。
核心组件
- Docker Compose:n8n 容器编排,定义环境变量、端口映射和数据卷
- SOCKS5代理:ALL_PROXY 环境变量将容器内 HTTP/HTTPS 流量转发到宿主机代理
- 容器内测试代理:curl --socks5 172.18.0.1:10808 https://ifconfig.me
关键能力
新增领域:Cloud Operating Model 云运营模型
企业级云运营模型(COM)通过四大支柱和六步设计法,为组织提供云投资有效管理、安全运营和可持续优化的标准化框架。
核心机制
- Cloud Operating Model:四大支柱(治理/自动化/安全/FinOps),六步设计法(评估→治理→自动化→FinOps→安全→优化)
- FinOps:实时成本追踪,Reserved Instances 可节省 40-70% 计算成本
- Zero Trust:零信任安全模型,永不信任持续验证,最小权限原则
- 多云策略避免供应商锁定,Kubernetes 实现工作负载可移植性
关键洞察
- 89% 企业将在 2025 年采用云优先架构(Gartner),但缺乏结构化方法的组织面临成本失控和安全漏洞
- AI 驱动异常检测可使停机时间减少 45%
新增领域:MinIO + Zipline 自托管图床
Synology NAS 通过 Docker 部署 MinIO 对象存储 + Zipline 图片托管服务 + PostgreSQL 元数据,构建完全自控的私有图床。
核心组件
- MinIO:兼容 S3 协议的对象存储引擎,数据持久化在 NAS
- Zipline:图片上传 Dashboard + REST API,与 n8n Workflow 集成
- PostgreSQL备份:pg_dump 热备份 + Synology Hyper Backup 增量归档
- S3协议:MinIO 核心配置参数(S3_BUCKET/ENDPOINT/ACCESS_KEY/SECRET_KEY/REGION/FORCE_PATH_STYLE)
关键洞察
- 存储性能仅受 NAS 硬盘/SSD 限制
- pg_dump + Hyper Backup 是防数据不一致的标准方案
新增领域:Trae Remote SSH 远程开发
Trae AI 代码编辑器通过 Remote SSH 连接 Ubuntu 服务器,结合 Docker Attach 模式和 Bind Mount,实现远程服务器上的隔离开发环境。
核心机制
- Remote SSH:Trae 在服务器安装 Trae Server,所有编辑操作在远程执行
- Docker Attach模式:直接进入 Docker 容器内部启动编辑器,完全隔离环境
- Bind Mount:宿主机目录挂载容器内,代码修改实时生效
- SSH Config HostName 可填写 Tailscale IP,实现内网/外网无缝切换
关键洞察
- Git 凭证通过 SSH Agent 转发解决
- 文件权限(UID/GID)问题:容器内生成文件归属 root,需在 Dockerfile 中指定用户
新增领域:Claude Skills 完整资源图谱与流程工程
Anthropic 官方 Skills 仓库 github.com/anthropics/skills 突破 3.2 万收藏,标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP,将人类经验封装为可复用工作流。
核心资源
- Anthropic 官方仓库:办公自动化(Word/PDF/PPT/Excel)、开发者工具箱(MCP Server/Web 测试/Artifacts 构建)、创意类 Skill
- 三大 Awesome 仓库:ComposioHQ、VoltAgent、BehiSecc,系统性整理 LLM Skills 工作流
- 三大聚合站:skillsmp.com、aitmpl.com、claudemarketplaces.com,拿来即用的 Skills 集
关键洞察
- Skills 核心是流程而非提示词,Vibe Coding 的尽头也是 Skills
- 真正有价值的不是 Prompt 写得多花哨,而是谁能将 SOP 交给 AI 稳定执行
新增领域:NotebookLM 7 种应用场景
NotebookLM 通过 Source-Grounding 机制(严格限制知识库仅含上传文档)实现高精度回答,每个答案附带精确引文。
7 种应用场景
- 信息管理:上传 PDF/文章/YouTube 链接,AI 自动处理并支持交互问答
- 被动学习:Audio Overviews 将文档转化为双人 AI 对话音频,支持 Brief/Deep Dive/Critique/Debate 风格
- 即时专家:上传多源资料快速建立领域认知
- 编程辅助:上传官方文档,通过问答定位知识点,替代冗长教程
- 项目管理:集中所有会议记录和战略文档,AI 自动生成结构化路线图
- 软件更新对比:同时上传多个版本发布说明,AI 提取差异并列出带引文变更清单
- 法律文档审查:严格基于上传文档回答,每问必带引文
关键洞察
- Source-Grounding 是 NotebookLM 与通用 AI 的本质区别:知识受限但精度极高
- 引文追溯让每个答案可验证,解决通用 AI 幻觉问题
新增领域:Agentic AI UX 设计五原则
Agentic AI(行动型 AI)与 GenAI(生成型 AI)的根本区别在于:Agentic AI 能感知环境、决策、预判并自主行动,而非仅生成内容。
五大设计原则
- 透明度:可视化 AI 任务进度和推理过程摘要,帮助用户理解 AI 决策逻辑
- 控制权:提供明确的停止机制和操作撤销能力,确保用户始终掌控 AI 行为边界
- 个性化:基于用户历史行为预测未来需求,主动提供个性化建议
- 对话式设计:自然语言界面取代传统点击,用户意图以对话方式传达
- 预判式设计:AI 主动预判需求并提前行动,但保留用户调整 AI 自主性等级的控制权
关键洞察
- 用户通过观察 AI"思考"过程实现参与,而非直接操作界面
- AI 自主性 aggressiveness 可调节,需在主动服务与用户控制之间取得平衡
新增领域:OpenClaw 照片整理实战
通过 OpenClaw AI Agent 实现 28 万张照片的自动化整理,将"没有想清楚"的问题前置化。
核心方法
- 精确去重:MD5 哈希比对,只删真正相同的文件
- 小文件清理:低于 100KB 的图片(截图/微信压缩图)自动移走
- 安全删除:待删文件先移至 To-Be-Deleted 目录而非直接删除
- 分批执行:68 个目录拆为 8 批次,每天凌晨 0 点自动执行
- AI Agent 思维方式:先问关键问题(格式/重复定义/删除策略)而非直接动手
关键洞察
- AI Agent 核心价值不是单点能力提升,而是思维方式升级——将模糊想法变成清晰结构
- Telegram 推送每批次执行 Summary 报告,实现真正的无人值守
新增领域:AI 时代赚钱思维模型
"普通人怎么在AI时代赚钱"的框架是错的,正确的问题是"AI 让我能做到什么以前做不到的事"。
三大核心原则
- 品味:AI 工具民主化后,能判断什么是真正好的成为稀缺护城河
- 端到端:别做别人 AI 流水线上的螺丝钉,做从 idea 到 product 的完整闭环
- 死亡过滤器:每天问自己是否还愿意做这件事,筛选真正的热爱
关键洞察
- AI 不会让普通人变富,但会让那些知道自己要做什么、且对品质有执念的人变得极其强大
// 新增领域:DevOps Culture and Transformation 四大支柱框架(2026-04-16 Batch 4) // 新增领域:RTO/RPO 现代灾难恢复体系与 Feature Flag 秒级 RTO(2026-04-16 Batch 4) // 新增领域:公有云/私有云/混合云三种部署模型对比与共享责任模型(2026-04-16 Batch 4) // 新增领域:Multi-Agent 虚拟团队协作模式(2026-04-15 PM) // 新增领域:Vibe-Kanban + OpenCode Ubuntu 部署(2026-04-15 PM) // 新增领域:Home Office 自托管服务三件套——MariaDB + Navidrome + rsync 增量备份(2026-04-15 Evening)
// 新增领域:n8n + Claude 自然语言工作流生成(2026-04-15 Night) // 新增领域:LLM Wiki vs RAG 的本质区别与持久化笔记系统(2026-04-15 Night) // 新增领域:一人公司 90 天跑通模式(2026-04-15 Night)
// 新增领域:Self-Improving + 双层记忆架构(2026-04-15 PM)
新增领域:baoyu-skills Claude Code 技能集
宝玉(JimLiu)发布的 Claude Code 技能集,通过 ClawHub 协议按单个 skill 安装,覆盖内容生成、AI 图像、日常效率工具三大类。
技能架构
- 内容技能:baoyu-xhs-images(小红书 9×6 风格布局)、baoyu-infographic(20×17 布局风格)、baoyu-cover-image(5维封面定制)、baoyu-slide-deck(4维度16预设)、baoyu-comic(5×8 画风基调)、baoyu-article-illustrator
- baoyu-imagine:9 家服务商自动选择(OpenAI/Google/Azure/OpenRouter/DashScope/MiniMax/即梦/豆包/Replicate),支持文生图/参考图/批量生成
- 工具技能:baoyu-translate(三模式翻译)、baoyu-youtube-transcript、baoyu-url-to-markdown、baoyu-x-to-markdown
发布协议
- ClawHub 按单个 skill 安装(clawhub install baoyu-imagine),而非 marketplace 批量安装
- EXTEND.md 支持用户级/项目级自定义,Env 配置支持 API Key 优先级覆盖
新增领域:Multi-Agent 虚拟团队协作模式
Solo founder 通过多 Agent 虚拟团队实现 24/7 全天候工作能力,每个 Agent 有独立角色/人格/模型,共享记忆,协作完成复杂任务。
核心机制
- 共享内存模式:GOALS.md(OKR 与优先级)+ DECISIONS.md(关键决策日志)+ PROJECT_STATUS.md(当前项目状态)
- 定时主动任务:Agent 主动在后台工作并推送结果,而非等待用户请求(早会摘要/指标推送/内容创意)
- Telegram路由:单群聊入口 + @AgentName 路由 + 无@默认 Lead Agent
- 从 2 Agent 开始,按瓶颈扩展,不是一上来建 4 个团队
实践案例
- Trebuh 的 4 Agent 团队(Milo/Josh/Marketing/Dev)+ Telegram + VPS,描述为"真正的 24/7 小团队"
新增领域:Vibe-Kanban + OpenCode Ubuntu 部署
Ubuntu Server 上通过 nvm 管理 Node 20,安装 Vibe-Kanban 与 OpenCode,pm2 管理进程,实现远程 AI 结对编程。
核心组件
- nvm:Node Version Manager(v0.39.7),安装和管理 Node 20
- Vibe-Kanban:AI 结对编程任务看板,Web UI(PORT 9999),自动 spawn OpenCode Executor
- pm2:进程管理器,pm2 start/logs/save/startup systemd
- OpenCode Executor:vibe-kanban spawn 的 AI 编程执行器,随机端口运行
关键约束
- 不要用 root 启动 OpenCode serve
- executor 随 vibe-kanban 进程一起管理,不单独用 pm2 管理
- I/O error 通常是 executor 没启动或端口被占用
新增领域:Home Office 自托管服务三件套
MariaDB 数据库
Synology NAS Docker 部署 MariaDB 10.11,通过 socket 本地登录管理,CREATE USER 创建远程访问账号。公网域名 mysql.ishenwei.online:63307 提供外网访问能力。
Navidrome 音乐服务器
Synology Docker 部署 Navidrome 开源音乐流媒体服务,音乐目录只读(:ro)挂载保护原始文件。ND_AUTOTRANSCODEDOWNLOAD 根据客户端能力自动转码,Subsonic API 兼容主流音乐 App。
rsync 增量备份自动化
rsync + NFS + /etc/fstab 永久挂载 + Crontab 凌晨 3 点自动化,构建"Clonezilla 整机镜像 + rsync 增量数据"二级保护体系。lockfile 防重入,mountpoint -q 防 NAS 掉线写爆本地硬盘。
核心概念
- Socket登录:MariaDB 本地连接方式
- NFS永久挂载:/etc/fstab + _netdev 等待网络就绪
- rsync增量备份:Delta-transfer 算法仅传输变化部分
- lockfile防重入:PID 文件 + kill -0 检测进程存活
新增领域:n8n + Claude 自然语言工作流生成
n8n 通过 MCP 协议与 Claude 连接,实现自然语言驱动的自动化工作流生成。
核心机制
- n8n-mcp:Claude 与 n8n 之间的 MCP 协议桥接,提供 543 个 n8n 节点的结构化访问
- AI工作流自动生成:Claude 生成 n8n 工作流 JSON 完成度约 80-90%,10-20% 错误率需人工修正
- 选择 Opensea 模型并开启 extended thinking 可显著提升生成质量
- n8n AI Agent 节点内置 Memory 机制,支持多轮对话上下文
关键区分
- Workflow vs Agent:预定义固定路径 vs LLM 动态决策
- Claude Code 的 delegate_task(Hermes 子 agent)vs terminal 调用 claude -p(MCP CLI 通道)
新增领域:LLM Wiki vs RAG 的本质区别与持久化笔记系统
通过 Obsidian + Gitea + OpenClaw 三层架构,将 AI 助手输出持久化为可积累的知识网络。
核心洞察
- LLM Wiki vs RAG:RAG 每次从零检索,知识不积累;LLM Wiki 让 AI 增量构建和维护持久化 Wiki,页面间互相链接
- AI 输出直接落盘到笔记(Obsidian)而非留在聊天记录,笔记通过 iCloud Drive 三端同步
- Gitea 提供 Git 版本管理,任何时候都能回溯历史版本
Obsidian 最佳实践
- Obsidian Web Clipper:浏览器插件快速采集外部素材
- Graph View:知识健康检查,发现孤岛页面和灰色幽灵节点(被引用但无专页的概念)
- Git自动同步:Auto commit-and-sync interval 完全自动化版本管理
- QMD:Wiki 规模到几百页后替代 index.md 提供精准搜索
知识管理原则
- 研究过程写入 Agent Archive(openclaw//)
- 经过验证可复用的知识沉淀到 Knowledge Base(knowledgebase/)
新增领域:一人公司 90 天跑通模式
从自我认知到商业变现,90 天跑通用最小杠杆撬动最大价值的一人公司。
核心框架
产品体系四层
- 引流(免费PDF)→ 入门(¥199 工具)→ 核心(¥4999 训练营)→ 高价(¥20000/月陪跑咨询)
- 价格锚定:高价咨询放顶部让低价显得便宜
- 内容矩阵:横轴核心主题 × 纵轴内容形式(观察/反直觉/操作指南/个人故事/清单)
- 反向金字塔:一次长形式内容切成无数微内容一次制作百次分发
四个心理陷阱
- 愧疚陷阱(不喜欢 = 别人也不喜欢)/ 效率陷阱(忙 = 创造价值)/ 卓越陷阱(必须亲自干)/ 努力陷阱(轻松 = 没价值)
新增领域:Self-Improving + 双层记忆架构
通过 self-improving skill + 双层记忆架构 + 每日定时复盘,实现 Agent 在错误中学习、持续进化,避免同一错误重复出现。
双层记忆架构
- 短期记忆:memory/YYYY-MM-DD.md 每日文件,每次 Session 启动时强制创建(解决记忆断层)
- 长期记忆:memory-lancedb-pro(LanceDB 向量数据库),语义搜索重要决策和偏好
- self-improving 层:LEARNINGS.md,Pattern-Key 追踪,Recurrence-Count 量化系统性
Self-Improving 核心机制
- Pattern-Key:经验记录唯一标识(如 cron.telegram-delivery),重复出现 = 系统性问题需系统性解决
- Recurrence-Count:重复次数计数器,≥2 说明这不是偶发错误
- 固定格式:Summary + Details + Suggested Action + Metadata(Pattern-Key/Recurrence-Count/See Also)
每日复盘
- 23:00 定时触发,读取当天 memory → self_improvement_log → 检查 Pattern-Key 重复 → 同步到长期记忆 → Telegram 摘要
- 发现机制:复盘时发现 3月27日无 memory 文件 → 推动"Session 启动时强制创建"流程优化
新增领域:多智能体可靠性架构(Alex Ewerlöf)
Alex Ewerlöf 提出的多智能体可靠性架构,将 LLM 视为分布式系统中不可靠组件而非拟人化智能体。
4 种架构模式
- Multi-Agent Hierarchy:Supervisor(规划器)+ Worker(工作者)+ Validator(验证器)三角色顺序协作,依赖图强制协作而非靠"喜欢"
- Multi-Agent Consensus:N 个模型独立响应同任务,多数票消除随机噪声(3 模型同谎言概率 0.8%),适合事实核查和分类
- Multi-Agent Adversarial Debate:Generator + Critic + Judge 三方对抗(法庭模型),Truth survives the fight,适合安全分析和代码审查
- Multi-Agent Knock-out:遗传算法启发的适应度淘汰制,最差代理被淘汰(cattle not pets),适合迭代式 Agent 工程
核心洞察
- 停止要求模型"小心",改为强制其"正确"(架构约束 > 情感化 prompt)
- LLM Sycophancy:过度迎合导致撒谎,多数投票可缓解
- 验证器可以是确定性代码(单元测试/JSON schema)而非 LLM
新增领域:Build Your Own X(费曼学习法实践)
build-your-own-x GitHub 项目通过"从零重建流行技术"来深度掌握编程,是费曼学习法在技术领域的系统性实践。
核心资源
- CodeCrafters:build-your-own-x 当前维护方,提供 codecrafters.io 在线编程挑战
- 25 个技术领域:3D Renderer / BitTorrent / Blockchain / Bot / Docker / Emulator / Git / Neural Network / OS / Regex / Search Engine / Web Browser 等
- 每个领域提供多语言实现(Python/JavaScript/Go/C++/Rust 等)
关键洞察
- "What I cannot create, I do not understand" — Richard Feynman
- BYOX 是 Vibe Coding 的底层实践,Vibe Coding 规划驱动,BYOX 从零实现
新增领域:Solo Founder 多 Agent 专精团队
Solo founder 通过多 Agent 虚拟团队实现 24/7 全天候工作能力,Multi-Agent Hierarchy 模式的具体 OpenClaw 实践。
团队配置模式
- Lead Agent(Milo):战略协调,制定计划,OKR 追踪
- Business Agent(Josh):数据分析,定价策略,竞品监控
- Marketing Agent:内容创意,Reddit/X 趋势监控
- Dev Agent:代码实现,技术架构,CI/CD
核心机制
- 定时主动任务:Agent 主动推送早会摘要/指标报告/内容创意,而非被动等待用户请求
- Telegram路由:单群聊 + @AgentName 路由 + 无@默认 Lead
- 2 Agent 起步按瓶颈扩展,而非一上来建 4 个团队
灵感来源
- Trebuh 的 4 Agent 实践("a real small team available 24/7")
- Nicholas Carlini 自主编码 Agent 方法论
新增领域:去中心化项目协调(STATE.yaml)
通过共享 STATE.yaml 文件替代中央 orchestrator,实现真正的并行 subagent 协作。
核心机制
- STATE.yaml:YAML 结构定义任务状态、owner、blocked_by、next_actions
- Git 作为审计日志:STATE.yaml 变更 commit 实现完整历史追溯
- 薄主会话原则:主 Agent 只做 spawn/send,不直接执行任务
与多 Agent 专精团队的关系
- 专精团队:多角色 Agent 并存,STATE.yaml 记录团队共享目标
- 去中心化协调:同一团队内无中央 orchestrator,各 Agent 自主读写状态
新增领域:东方人生智慧
道家、儒家、佛教经典箴言体系,补充西方哲学框架之外的人生哲学视角。
核心命题
- 空性智慧:一切有为法如梦幻泡影露水电,不执着于"自性"(金刚经)
- 绝处逢生:"行到水穷处,坐看云起时",困境即转机的东方智慧(王维)
- 知其不可奈何而安之若命:先尽人事,后听天命,接纳与行动的平衡(庄子)
- 和光同尘:收敛锋芒,不标新立异,与世无争以保全自身(老子/曾国藩)
与苏东坡视角的关系
- 一语点醒梦中人 与 su-dongpo-perspective 均属东方人生智慧,后者侧重苏东坡的文学与政治生涯视角
// 新增领域:NotebookLM 开源平替生态(2026-04-16 Batch 2 Continued) // 新增领域:Nano-Banana Pro 进阶提示词策略(2026-04-16 Batch 2 Continued) // 新增领域:AI时代赚钱三原则(2026-04-16 Batch 2 Continued)
新增领域:NotebookLM 开源平替生态
Google NotebookLM 的开源替代品生态已成熟,覆盖从本地文档处理到企业级知识库的完整场景。
核心产品
- Open Notebook(14.6k ⭐):功能最完整的 NotebookLM 平替,支持 16+ AI 提供商(OpenAI/Anthropic/Gemini/Ollama/LM Studio),多模态输入+4角色播客生成
- SurfSense(11.4k ⭐):定位 NotebookLM+Perplexity+Glean 合一,Notion/YouTube/GitHub 外部数据源整合+语义+全文混合搜索+RBAC,适合企业知识库
- Podcastfy:专注播客生成,100+ LLM+4 种 TTS 引擎,Shorts 和 Longform 两种格式
- PageLM:教育平台,自动生成康奈尔笔记(SmartNotes)+互动测验+Flashcards+ExamLab
- InsightsLM:Supabase+N8N+React 架构,私有化部署,支持 Ollama/Qwen3 本地模型
关键洞察
- 开源平替已覆盖 NotebookLM 全部核心功能(文档问答/引用/播客生成)
- Open Notebook 在功能完整性上最接近原版,SurfSense 在研究场景最强
新增领域:Nano-Banana Pro 进阶提示词策略
Google Nano-Banana Pro 从"娱乐级"升级到"专业级资产生产",是"思考模型",理解意图、物理和构图而非简单关键词匹配。
10 大能力维度
- Text Rendering:SOTA 文字渲染,信息图/蓝图/白板/技术图纸多种风格
- Identity Locking:14 张参考图(6 高精度),单次生成 Viral Thumbnail(Identity+Text+Graphics)
- Google Search Grounding:实时数据可视化,减少时效性话题幻觉
- Advanced Editing:In-painting/Restoration/Colorization/Style Swapping,语义指令替代手动遮罩
- 2D↔3D 转换:户型图→室内设计稿,平面图→3D 可视化
- 4K 原生输出:1K-4K 分辨率,高保真纹理
- Thinking Mode:中间推理图(不收费)优化构图,再渲染最终输出
- One-Shot Storyboarding:单次会话生成连贯叙事流的故事板
- Layout Guidance:草图/线框图/网格图严格控制构图和布局
- Pixel Art & LED Display:64x64 网格生成,驱动 LED 矩阵
黄金四法则
- Edit Don't Re-roll:图像 80% 正确时不重新生成,只要求具体修改
- 自然语言完整句子:像给人类艺术家 brief,而非堆砌标签
- 具体描述:Subject + Setting + Lighting + Mood
- 提供上下文:Why 或 For Whom,帮助模型做逻辑性艺术决策
新增领域:AI时代赚钱三原则
以乔布斯视角提出的 AI 时代赚钱思维框架——品味值钱、端到端做事、死亡过滤器筛选热爱。
三原则
- 品味值钱:AI 工具民主化后,品味是真正的护城河,能判断什么是真正好的比只会点"生成"的人强一百倍
- 端到端:别做别人 AI 流水线上的螺丝钉,做从 idea 到 product 的完整闭环
- 死亡过滤器:每天问自己如果今天是最后一天还会不会做这事,筛选真正的热爱
正确问题框架
- ❌ 错误:「普通人怎么在AI时代赚钱」(被动挨打)
- ✅ 正确:「AI 让我能做到什么以前做不到的事」(主动创造)
来源
乔布斯.skill — 通过 Claude Code Skills 封装的乔布斯视角思维框架
新增领域:DevOps Culture and Transformation 四大支柱框架
DevOps 超越工具层面,进入思维模式转变,通过文化、运营和技术三位一体实现软件交付能力的系统性提升。
四大支柱
- 协作优先于孤岛:跨职能团队共享软件全生命周期所有权,打破 Dev 与 Ops 的组织壁垒
- 自动化即赋能者:CI/CD Pipeline + IaC 将人工程序自动化,释放团队聚焦高价值工作
- 持续改进(Kaizen):无责复盘、数据驱动瓶颈识别、混沌工程主动测试系统韧性
- 客户中心:Feature Flagging 嵌入式反馈、A/B 测试数据驱动决策
敏捷整合
- Scrum/Kanban 为结构化迭代或持续流动提供框架
- DevSecOps 将安全左移(Shift-Left)在开发阶段即嵌入
- Value Stream Mapping 可视化工作流消除等待和浪费
AI/ML 赋能趋势
- GitOps 以 Git 作为单一真实源管理基础设施
- Serverless DevOps 通过 FaaS 减少运维开销
- Edge Computing DevOps 实现近用户侧实时应用性能优化
关键实体
新增领域:RTO/RPO 现代灾难恢复体系与 Feature Flag 秒级 RTO
传统灾难恢复聚焦稀有硬件故障,现代 DevOps 的最大风险已转向代码变更引入的缺陷。Feature Flag 将 RTO 从"部署回滚时间"(小时级)降至"配置变更时间"(秒级)。
RTO vs RPO 核心差异
- RTO:系统可容忍的最大停机时间,衡量速度
- RPO:可接受的最大数据丢失量(从故障时刻往前回溯),衡量数据完整性
- 两者必须协同优化:快速恢复但大量数据丢失,或缓慢恢复但零数据丢失,均不完整
三级分层体系
| 级别 | 示例 | RTO | RPO |
|---|---|---|---|
| Tier 1 关键 | 支付/用户认证 | <5 分钟 | <1 分钟 |
| Tier 2 重要 | 管理后台/报表 | <1 小时 | <15 分钟 |
| Tier 3 可选 | 内部工具/文档站 | <4 小时 | <1 小时 |
Feature Flag 改变灾难恢复范式
- 部署 ≠ 发布:代码可部署到生产环境但默认不向用户开放
- Kill Switch:Flip the Flag 而非 Debug under pressure
- 渐进式发布:1%→5%→25%→100%,将影响范围控制在局部
- HP:将回滚时间从小时级降至分钟级
- Christian Dior:将 15 分钟回滚降至即时开关
关键洞察
- "预防优于补救":主动质量保障(渐进式发布+测试)成本永远低于被动灾难恢复
- 成本收益原则:不要为防止 $10K/小时停机损失花 $100K/年基础设施
关键实体
- LaunchDarkly:企业级 Feature Flag 平台,86% 客户可在一天内恢复
新增领域:公有云/私有云/混合云三种部署模型与共享责任
三种云部署模型并非互斥,实际组织应根据工作负载特征采取混合策略,每种模型在安全/性能/成本/合规之间有不同权衡。
三种模型对比
| 维度 | 公有云 | 私有云 | 混合云 |
|---|---|---|---|
| 成本 | 按需弹性,规模化后指数增长 | TCO 高,固定投入 | 可优化,但管理复杂 |
| 安全 | 多租户,隔离弱 | 专用环境,高安全 | 敏感负载在私有,弹性在公有 |
| 合规 | 需额外措施 | 高度可控 | 按负载分配 |
| 弹性 | 强 | 受限于物理硬件 | 公有侧弹性,私有侧稳定 |
| 适用 | 开发测试/峰值扩展 | 金融/政府/敏感数据 | 大多数企业实际选择 |
公有云适用场景
- 可预测计算需求(固定用户量的通信服务)
- 软件开发测试环境
- 应对不可预测的峰值负载
私有云适用场景
- 高度监管行业(金融/政府/医疗)
- 敏感商业数据
- 需要强控制和定制化的超大型企业
混合云核心价值
- 策略驱动的工作负载分配:安全敏感负载在私有云,弹性需求在公有云
- 业务连续性:分布式架构使灾难恢复更容易
- 成本效率:日常负载在廉价的公有云,峰值弹性扩展
共享责任模型
无论哪种部署模式,组织均对以下责任负责:
- 访问控制:谁可以访问什么资源
- 数据安全与加密:静态和传输中数据加密
- 灾难恢复规划:RTO/RPO 设计与测试
- 合规性:满足行业法规要求
// 新增领域:AI配音与声音克隆工具生态(2026-04-16 Batch 7) // 新增领域:AI时代产品经理能力重塑与超级个体(2026-04-16 Batch 7) // 新增领域:东方人生智慧新批次——知其不可奈何/忘机消众机/飘风不终朝(2026-04-16 Batch 7) // 新增领域:arXiv Paper Reader——对话式论文阅读助手(Prismer arxiv-reader skill + LaTeX自动展平 + 多篇对比)(2026-04-16 Batch 11) // 新增领域:Custom Morning Brief——定时主动任务晨报(夜间待机转化 + AI推荐可代劳任务)(2026-04-16 Batch 11) // 新增领域:Event Guest Confirmation——SuperCall AI外呼确认(GPT-4o Realtime + Twilio + 沙箱化Persona防泄露)(2026-04-16 Batch 11) // 新增领域:Daily Reddit Digest——Reddit内容聚合与偏好记忆(reddit-readonly skill + 个性化digest + Read-only模式)(2026-04-16 Batch 11) // 新增领域:Obsidian Tasks 插件——任务-笔记一体化(笔记+任务融合,Tasks查询语法,重复任务计划)(2026-04-16 Batch 10) // 新增领域:系统提示词构建原则——Claude Code Agent 行为准则(5维度94条准则,行为可预期性设计)(2026-04-16 Batch 10) // 新增领域:Dataview——笔记数据库插件,类SQL语法查询实现笔记资产盘活(2026-04-16 Batch 10) // 新增领域:基础RAG三阶段管道——Indexing→Retrieval→Generation,Qwen+BAAI+LangChain+Qdrant技术栈(2026-04-16 Batch 10) // 新增领域:LLM核心术语框架——LLM/MCP/Agent/RAG/vLLM/Token/数据蒸馏系统梳理(2026-04-16 Batch 10)
新增领域:arXiv Paper Reader——对话式论文阅读助手
通过 Prismer AI 的 arxiv-reader skill,OpenClaw Agent 变身为专业论文阅读助手,解决 arXiv PDF 阅读的三大痛点:下载后上下文跳跃、LaTeX 符号难解析、多篇论文无法对比。
核心机制
- arxiv-reader skill:3 工具接口(arxiv_fetch/arxiv_sections/arxiv_abstract),Node.js 内置模块实现,无 Docker/Python 依赖
- LaTeX Flattening:自动解压 LaTeX 源码并展平\include 子文件,生成可读连续文档
- 多篇对比:批量获取摘要并生成对比表格,辅助 reading list 优先级排序
- 本地缓存:二次访问即时返回,无重复下载
与其他 Agent Use Cases 的关系
- arXiv Paper Reader 与 Custom Morning Brief 共用"定时主动任务"能力
- AI 论文阅读能力是 内容工厂 和 产品工厂 的上游输入
新增领域:Custom Morning Brief——定时主动任务晨报
OpenClaw 定时晨报工作流将用户"最生产力的早晨时间"从信息获取转化为决策制定——新闻、待办、AI 主动推荐任务在起床前已准备完毕。
核心机制
- 定时主动任务:Agent 在无用户请求时主动执行并推送结果,核心价值是"AI 推荐可代劳的任务"
- 晨报自动化:早晨信息聚合(新闻+天气+日历)+ 待办推送 + AI 主动建议
- AI推荐任务:Agent 主动识别可自动化事项,而非仅推送信息
- 夜间待机转化:用户睡眠期间 AI 完成研究/写作任务,产出完整脚本/商业提案
触发条件
- 定时 Cron(每日 8:00 AM)
- 自定义:用户短信向 Bot 说明需求即可调整结构
关键依赖
- Alex Finn 的 YouTube 视频《Life-Changing OpenClaw Use Cases》激发此工作流
- Telegram/Discord/iMessage 任一消息渠道
- Todoist/Apple Reminders/Asana 任一任务管理器
新增领域:Event Guest Confirmation——SuperCall AI 外呼确认
通过 SuperCall AI 语音 Agent 实现活动宾客批量确认,解决手动电话 20+ 人的繁琐流程。
核心机制
- SuperCall:@xonder/supercall OpenClaw 插件,GPT-4o Realtime 语音驱动
- 沙箱化 Persona:每通电话独立上下文重置,不跨对话记忆,防止 Prompt 注入
- 调用链路:SuperCall → OpenAI GPT-4o Realtime API → Twilio 拨号
- 完整工作流:准备宾客人列 → 逐一外呼 → 记录结果 → 全量汇总(确认/拒绝/未接+备注)
安全设计
- AI Persona 只能访问提供的上下文(角色名+目标+开场白),不访问 OpenClaw Gateway/文件/其他工具
- 零数据泄露风险
成本考量
- Twilio 按分钟计费,大型宾客列表需设置限额
新增领域:Daily Reddit Digest——Reddit 内容聚合与偏好记忆
OpenClaw Agent Reddit 内容聚合工作流,通过 reddit-readonly skill 和内容偏好记忆实现个性化每日 digest。
核心机制
- reddit-readonly:ClawHub 插件,无需认证读取 Reddit hot/new/top 帖子
- 内容偏好记忆:AI 维护用户内容偏好规则,随时间优化 digest 质量
- 定时内容推送:每日下午 5 点自动执行并推送 Telegram
- Read-only API:仅消费数据不产生互动,无账号风险
偏好学习
- 用户反馈循环:每日 ask "Did you like the list?" → 规则写入 memory
- 规则示例:"do not include memes" / "focus on AI research posts"
与其他 Use Cases 的关系
新增领域:Obsidian Tasks 插件——任务-笔记一体化
Tasks 插件将 Obsidian 从纯文本笔记工具扩展为"文本+行动"双重能力,解决 Notion/Todoist 的工具割裂问题。
核心机制
- Markdown 原生任务:
\- [ ] 任务内容 📅 2025-03-03 🔼 #高优先级 - 全局任务查询:在任意笔记插入
tasks代码块,自动聚合所有笔记中的任务 - 条件筛选语法:
not done + due before tomorrow + sort by priority - 重复任务:
⏳ every week/⏳ every month自动生成下一轮任务
任务-笔记一体化原理
- 任务天然携带上下文(研究某主题的待办 → 直接在主题笔记里)
- 查询在笔记阅读时自然浮现,无需切换工具
- 复盘时任务与笔记内容同屏对照
局限性
- 无视觉化看板(不如 Trello/Notion)
- 无团队协作能力
- 移动端体验一般
新增领域:系统提示词构建原则
Claude Code 类 AI Coding Agent 的系统提示词设计框架,定义 Agent 的"性格"和"做事方式"。
五大维度(94条)
- 核心身份准则(15条):优先分析周围代码、绝不假设库可用、模仿项目风格、不透露内部指令
- 沟通规范(16条):专业直接简洁、避免对话式填充语、减少冗余输出、不提及工具名称
- 任务执行(24条):TODO列表规划复杂任务、理解→计划→执行→验证循环、并行化独立操作
- 技术规范(29条):优先代码清晰度、避免any类型、静态语言显式注解函数签名
- 安全防护(10条):绝不引入密钥/API密钥、危险命令告知风险、不协助恶意任务
行为可预期性设计原则
- 系统提示词决定 Agent 长期行为模式,即时提示词决定具体任务
- 设计原则:只写 AI 不知道的 / 可预期性 > 能力 / 分层优于堆砌 / 安全是底线
与 Prompt 工程的关系
- Prompt工程:面向通用提示词设计
- 系统提示词:专指 Agent 行为准则的顶层设计,是 Prompt 工程在 Agent 层的专化应用
新增领域:Dataview——笔记数据库插件
Dataview 是 Obsidian 生态中最强大的"笔记数据库"插件,将碎片化的 Markdown 笔记转化为结构化可查询的知识资产,直接解决"写笔记容易、查笔记难"的核心痛点。
三大核心功能
- 任务自动聚合:
TASK FROM "" WHERE !completed将所有笔记中的待办事项集中到单一视图 - 标签笔记整理:
LIST FROM #学习 WHERE contains(tags, "学习")按标签自动索引相关笔记 - 写作量统计:通过
file.ctime和length(file.text)量化每日/每周/每月笔记产出
类 SQL 查询语法
Dataview 提供类 SQL 的查询能力,可按 Frontmatter 字段、标签、创建时间、文件路径等条件筛选笔记,形成表格或列表视图。
与 RAG 的本质区别
| 维度 | Dataview | RAG |
|---|---|---|
| 索引方式 | 结构化字段 | 向量语义 |
| 查询方式 | 精确条件 | 模糊语义 |
| 数据源 | 本地笔记 | 外部文档 |
| 适用场景 | 元数据明确的笔记查询 | 自然语言文档检索 |
新增领域:基础RAG三阶段管道
RAG(检索增强生成)是 LLM 落地生产的事实标准架构,通过外部知识检索显著提升 LLM 回答质量(考试正确率 60%→90%)。
三阶段管道
- Indexing:文档加载 → 文本分块(Split,512~8192 token Context Window 限制)→ BAAI Embedding 向量化 → 存入 Qdrant 向量数据库
- Retrieval:Query 向量 → 在 Vector Store 中按余弦相似度检索 Top-K 相关文档块
- Generation:Query + Top-K Context → PromptTemplate → LLM 生成答案
核心技术栈
- LLM:Qwen(通义千问)
- Embedding:BAAI/bge 系列开源模型
- 编排框架:LangChain(160+ 文档加载器)
- 向量数据库:Qdrant(Rust,高性能)
- 监控调试:LangSmith(可视化 RAG Pipeline 各环节 Latency/Token/Trace)
关键概念
- 文档分块(Chunking):固定长度/段落/递归/语义等多种切分策略,chunk_size 和 overlap 是核心参数
- 向量检索(Vector Search):按余弦相似度而非字面匹配检索,是 RAG 检索层的核心技术
- 嵌入向量(Embedding):文本通过 Embedding Model 转为固定长度浮点数向量,计算语义距离
新增领域:LLM核心术语框架
LLM 技术栈从模型到应用形成完整体系,涵盖参数规模基准、工具调用协议、推理优化等多个维度。
核心术语
- LLM:≥1B 参数的语言模型为"大模型"门槛,GPT-2(1.5B)、GPT-3(175B)
- Token:LLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符,API 按 Token 计费
- Embedding:向量化,将词转化为浮点数字计算语义距离(一百和两百距离近,一百和一千距离远)
- RAG:检索增强生成,通过外部知识检索解决 LLM 幻觉问题
协议与架构
- Prompt:人与 LLM 的协作协议,核心是消除信息差,引导模型按预期方式响应
- MCP(模型上下文协议):标准化 LLM 与外部工具/数据的通信协议,MCP Server 负责实际执行,LLM 只给步骤
- Agent:智能体,LLM + MCP 工具整合后实现实际任务执行,大模型负责推理,工具负责执行
推理优化
- vLLM:通过 PagedAttention(块式 KV Cache)和连续批处理优化 GPU 利用率,是当前最高效的 LLM 推理框架之一
- 数据蒸馏:用大模型生成精简数据训练小模型,用高质量合成数据弥补小模型能力差距