43 KiB
LLM Wiki Overview
核心主题
AI开源生态在2025年取得突破性进展,国产模型在多个领域成为国际闭源产品的有力替代。同时,DevOps 文化与转型方法论为组织提供数字化交付能力建设的系统性指导。
主要领域
- 大语言模型:DeepSeek R1、Qwen 3等国产模型在深度推理和工具调用上达到世界领先水平
- AI生图:Flux和Stable Diffusion主导开源生态,Flux在人体解剖学正确性上表现最佳
- AI生视频:HunyuanVideo以最大参数量成为开源视频生成标杆
- 通用智能体:Manus定义AI Agent元年,OpenManus提供开源实现
- AI编程:Cline将VS Code变身全自动AI工程师
- 智能体工作流:n8n(16万Star)和Dify实现可视化AI流程编排
- AI搜索:Perplexica实现完全本地化的开源搜索
- DevOps 文化与转型:四大支柱驱动组织数字化交付能力
- DevOps 成熟度评估:DORA 四指标 + 云成熟度 5 级模型
- Linux 运维:150 个核心命令覆盖系统管理全场景
关键趋势
- 深度推理让AI学会"慢思考"
- 开源内卷将价格打成白菜价
- 国产开源模型在多个领域实现差异化竞争
- DevOps 向 GitOps、AI 赋能、Serverless 和 Edge Computing 方向演进
新增领域:Agent Use Cases 四大工作流
1. Autonomous Project Management(去中心化项目管理)
基于 STATE.yaml 的去中心化协调模式,替代传统中央 orchestrator。subagent 通过读写共享状态文件自主协作,Git 作为审计日志,主会话保持薄(CEO 模式)。灵感来源:Nicholas Carlini。
2. Content Factory(内容工厂)
Discord 多 agent 链式协作管线:Research Agent 扫描趋势 → Writing Agent 生成脚本 → Thumbnail Agent 生成配图,全部自动执行定时运行。Alex Finn YouTube 视频激发此工作流设计。
3. Market Research & Product Factory(产品工厂)
Last30Days 挖掘 Reddit/X 真实用户痛点 → ranked pain points → OpenClaw 构建 MVP。零编码要求,每周定时追踪市场演变。核心依赖:Matt Van Horne 的 Last30Days skill。
4. Personal Knowledge Base RAG(个人知识库)
基于 RAG 的第二大脑:Drop any URL 自动摄取 → 向量嵌入 → 语义搜索返回 ranked 结果+来源引文。支持其他 agent 工作流主动查询。
新增领域:Claude Skills 与流程工程
Claude Skills 的爆发标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP,将人类经验封装为可复用工作流。Anthropic 官方 Skills 仓库(github.com/anthropics/skills)收藏数突破 3.2 万,包含生产级 Skills:办公自动化、开发者工具箱、创意类 Skill。Vibe Coding 的尽头也是 Skills。
关键概念
资源生态
- 三大 Awesome 仓库:ComposioHQ、VoltAgent、BehiSecc
- 三大聚合站:skillsmp.com、aitmpl.com、claudemarketplaces.com
新增领域:NotebookLM 与 Source-Grounding
NotebookLM 通过 Source-Grounding 机制(严格限制知识库仅含上传文档)实现高精度回答,每个答案附带精确引文。可作为被动学习(Audio Overviews)、项目管理、法律文档审查、软件更新对比等多种场景的 AI 助理。
关键能力
- Source Grounding:消除幻觉,确保回答可溯源
- 被动学习:Audio Overviews 在碎片时间消费复杂信息
- 引文追溯:每个回答附带原文引文
新增领域:AI图生视频
2025年底,AI图生视频技术快速成熟,14款免费工具已能生成高质量视频,覆盖电商模特、内容创作、广告制作等多场景。
主要产品
- 绘蛙AI视频(阿里巴巴):模特图转视频,操作简便
- 智谱清影(智谱AI):30秒生成6秒高清视频,支持风格选择
- Vidu(生数科技+清华大学):全球首个"多主体参考"功能
- 可灵AI(快手):3D时空联合注意力,物理逻辑动作生成
- 海螺AI(MiniMax):主体一致性保持,光影色调高度一致
- Stable Video(Stability AI):LoRA摄像机精细控制
关键能力
新增领域:DevOps 文化与转型
核心框架
DevOps 建立在四大支柱之上:协作优先于孤岛、自动化即赋能者、持续改进(Kaizen)、客户中心。
关键实践
- CI/CD Pipelines:自动化构建、测试、部署流水线(Jenkins、GitHub Actions、GitLab CI)
- Infrastructure as Code:以代码管理基础设施(Terraform、AWS CloudFormation)
- DevSecOps:在 CI/CD 中内置安全(SonarQube、Snyk)
- GitOps:以 Git 为单一真实源管理配置
工具生态
- 监控可观测性:Prometheus、Grafana、Datadog
- 容器化:Docker、Kubernetes
- 配置管理:Ansible(Red Hat)
未来趋势
- AI/ML 赋能 DevOps(代码审查智能自动化、异常检测、自愈基础设施)
- Serverless DevOps:FaaS 减少运维开销
- Edge Computing DevOps:边缘节点实时应用优化
新增领域:DevOps 成熟度与云成熟度评估
DevOps 成熟度模型
DevOps 成熟度评估帮助组织了解当前效能水平并识别改进方向,核心框架为 Google DORA 团队提出的四指标体系。
DORA 四指标
- DORA指标:部署频率、变更前置时间、变更失败率、平均恢复时间
- 精英团队:每天多次部署、变更前置时间 < 1 天、变更失败率 0-15%、MTTR < 1 小时
- 关联概念:Kaizen、Chaos Engineering(主动测试系统韧性)
云成熟度 5 级模型
- Level 0(Legacy):无云准备,纯本地遗留系统
- Level 1(Initial):初始准备,少数系统试点云服务
- Level 2(Repeatable):可重复,建立流程和采购规范
- Level 3(Systematic):系统化文档化,有管理流程和合规策略
- Level 4(Measured):可测量,云原生应用广泛采用
- Level 5(Optimized):优化,数据驱动决策,灵活跨云迁移工作负载
三要素评估
- People:技能与工作方式转型
- Processes:工作流优化
- Technology:基础设施适配
Forrester 预测
2025 年全球云成熟度模型市场达 15 亿美元,60%+ 组织已实施云成熟度模型。
新增领域:Linux 运维 150 命令
Linux 命令是系统管理的核心,核心理念为"一切皆文件"——CPU、内存、磁盘、键盘、鼠标、用户都是文件。
命令分类
- 线上查询:man(命令帮助)、help(内置命令帮助)
- 文件目录操作:ls/cd/cp/find/mkdir/mv/pwd/rename/rm/rmdir/touch/tree/basename/dirname/chattr/lsattr/file/md5sum
- 文件内容处理:cat/tac/more/less/head/tail/cut/split/paste/sort/uniq/wc/iconv/dos2unix/diff/vimdiff/rev/grep/join/tr/vi/vim
- 压缩解压:tar/unzip/gzip/zip
- 信息显示:uname/hostname/dmesg/uptime/stat/du/df/top/free
关键概念
新增领域:Nano Banana 结构化提示词框架
Google Nano Banana 是图像生成提示词的结构化框架,通过 9 个标准化字段(Shot/Subject/Environment/Lighting/Camera/ColorGrade/Style/Quality/Negatives)将创意描述转化为机器可执行参数。
关键机制
- negatives(负向提示词)是质量控制关键字段
- camera 字段提供电影级构图控制(焦距/光圈/角度)
- 物件描述框架与人物描述框架共用同一结构,subject 字段内容不同
关键概念
- Nano Banana:Google 发布的结构化图像提示词框架
- 负向提示词:明确排除不需要的特征
新增领域:Claude + n8n-mcp AI 工作流自动生成
Claude 与 n8n-mcp 结合,通过自然语言直接生成 n8n 工作流,降低自动化门槛。
核心机制
- n8n mcp:提供 543 个 n8n 节点的结构化访问,271 个 AI 能力节点
- Claude 自动生成工作流完成度约 80%-90%,10%-20% 错误率需人工修正
- 选择 Opensea 模型并开启 extended thinking 可显著提升生成质量
关键能力
新增领域:MCP 在 Cursor 中的集成
MCP 协议为 Cursor 提供与大模型外围服务的高效集成能力。
核心机制
- MCP:Client-Server 架构,3 种接口(资源读取/工具调用/Promise 提示词)
- Composer:Cursor 对话模块,支持 Agent 模式和 Normal 模式
- Agent模式:自动执行 MCP 工具链,减少手动操作
- Sequential Thinking:逻辑推理分步工具,提升 AI 决策质量
关键区分
- Agent 模式:工具链自动串联
- Normal 模式:需手动复制命令
- enable yolo mode:风险高,默认关闭
新增领域:Google 5 种 Agent Skill 设计模式
Google Cloud 发布的 Skill 内容结构化设计模式,解决 SKILL.md 格式标准化后执行效果差异大的问题。
5 种模式
- Tool Wrapper:监听关键词动态加载规范文档,适合团队编码规范分发
- Generator:通过"填空"流程强制一致输出格式
- Reviewer:分离检查清单与检查逻辑,换清单即换审计类型
- Inversion:agent 先问你再做,逐阶段收集信息
- Pipeline:带硬性检查点的严格顺序工作流
Anthropic 补充
- 最好的 Skill = 工具箱,而非"写好的提示词"
- 写 Skill 三条铁律:只写 Agent 不知道的、重点写踩坑清单、给工具不给指令
- 5 种模式可组合(Pipeline 包含 Reviewer、Generator 依赖 Inversion)
关键能力
- 渐进式披露:ADK 机制,agent 只在需要时才加载特定 token
新增领域:Claude Code 调用模式
OpenClaw/Hermes 通过 terminal 工具调用 Claude Code,两种核心模式满足不同场景需求。
关键机制
- Print Mode:stdin 管道非交互模式,适合绝大多数编程任务
- TMUX交互模式:tmux session 交互模式,适合超长任务
--permission-mode bypassPermissions跳过所有交互确认,是自动化调用的必要条件--add-dir自动扫描 SKILL.md 并在触发条件匹配时激活
关键区分
- delegate_task 仅调用 Hermes 子 agent,无法建立 Claude Code CLI 通道
- Skill 调用必须使用 terminal + claude -p
新增领域:baoyu-skills Claude Code 技能集
宝玉发布的 Claude Code 技能集,通过 ClawHub 协议支持按单个 skill 安装,涵盖内容生成、AI 图像创作、日常效率工具三大类。
技能架构
- 内容技能:baoyu-xhs-images(小红书9×6风格布局)、baoyu-infographic(20×17布局风格)、baoyu-cover-image(5维封面定制)、baoyu-slide-deck(4维度16预设)、baoyu-comic(5×8画风基调)、baoyu-article-illustrator
- baoyu-imagine:9 家服务商自动选择(OpenAI/Google/DashScope/MiniMax/即梦/豆包/Replicate等)
- 工具技能:baoyu-translate(三模式翻译)、baoyu-youtube-transcript、baoyu-url-to-markdown
发布协议
- ClawHub 按单个 skill 安装(clawhub install baoyu-imagine),而非 marketplace 批量安装
- EXTEND.md 支持用户级/项目级自定义,Env 配置支持 API Key 优先级覆盖
新增领域:AI 产品经理工作流
AI 时代产品经理将 Gemini 深度嵌入需求文档、FeatureList、逻辑图、HTML 原型的全链路工作流。
核心方法
- FeatureList 共创:与 Gemini 构思需求框架,AI 补全层级和边界场景
- PRD自动生成:分页面逐一描述 + PRD 写作指南模板 + 调教反馈
- Mermaid 代码生成 ER 图、泳道图、甘特图(飞书原生支持)
- HTML 原型同步生成 + 差量维护 = 永远最新的交互原型库
核心洞察
- Gemini = 知识渊博但不带脑子的苦工,表述越准执行越准
- 超级个体 = 某领域八九十分 + AI 横向扩展,AI 是充分非必要条件
- 市场洞察力 = 产品经理最稀缺也最重要的能力,AI 时代更重要
新增领域:递归自优化生成系统的形式化框架
tuuai 提出的自递归优化生成系统,将 AI 自我改进机制纳入固定点语义与 λ-calculus 的数学框架。
核心机制
- α-提示词(生成器 G)→ Ω-提示词(优化器 O)→ 元生成器(M)→ 自映射 Φ(G) = M(G, O(G(I), Ω))
- 稳定生成能力 = Φ 的固定点 G*:Φ(G*) = G*
- 自举(Bootstrapping):用优化产物反馈给系统,启动下一轮进化
- Y Combinator 表达:G* = Y STEP,满足 G* = STEP G*
关键命题
- 自优化的目标不是单次最优输出,而是生成器空间 {G_n} 的收敛行为
- 固定点 对应系统不动点,即自洽的稳定生成能力
- 自递归优化生成系统 与 Agent Skill Generator Pattern 形成理论与实践的对应
新增领域:LLM 核心术语与技术框架
LLM 技术栈从模型到应用形成完整体系,涵盖参数规模基准、工具调用协议、推理优化等多个维度。
核心概念
- LLM:≥1B 参数的语言模型为"大模型"门槛,GPT-2(1.5B)、GPT-3(175B)
- MCP:Model Context Protocol,LLM 与外部工具的标准化通信协议
- Agent:大模型 + MCP 工具整合后实现实际任务执行,大模型仅输出步骤,执行需依赖 MCP
- RAG:Retrieval-augmented generation,通过检索增强解决幻觉问题(考试正确率 60%→90%)
- Embedding:向量化,将词转化为浮点数字计算语义距离
- vLLM:通过 PagedAttention(块式 KV Cache)和连续批处理优化 GPU 利用率
- Token:LLM 基本输入单元,中文约 0.6 token/字符,英文约 0.3 token/字符
- 数据蒸馏:用大模型生成精简数据训练小模型
关键洞察
- MCP 协议核心约束:大模型不执行实际调用,只给出步骤建议
- vLLM 推理优化:PagedAttention 避免内存碎片化,连续批处理减少头阻塞
新增领域:Vibe Coding 氛围编程
Vibe Coding = 规划驱动 + 上下文固定 + AI 结对执行,让想法到可维护代码成为可审计流水线。
核心方法论
- 开发者从"写代码的人"转变为"指挥 AI 写代码的导演"
- 保持对产品逻辑、用户流程、审美和交互的"感觉"
- 规划是一切:技术选型、实施规划、模块化设计
- AI 工具(Cursor、Windsurf、Trae)承担体力活
推荐资源
- vibe coding cn:中文开发者 Vibe Coding 资源库与工作站
- Cursor + claude-opus-4.5-xhigh 为推荐工具组合
新增领域:Agentic AI 赋能 Cloud DevOps
Agentic AI 将传统响应式 DevOps 转变为预测性、自动化运维。
七大应用场景
- 自主检测与修复:K8s、数据库、存储异常自动修复(MTTR 降低)
- 智能 IaC 管理:审查 Terraform、CloudFormation、Pulumi 脚本
- 成本优化:动态扩展、Spot/Reserved 实例优化(夜间负载转移降低 40% 成本)
- 安全合规:IAM 策略扫描、容器漏洞检测、实时修复
- 日志分析与可观测性:AI 驱动的根因分析
- 多租户 SaaS 管理:自动化创建、配置、归档租户
- AI 增强决策:What-If 模拟、异常检测
关键能力
- Self-Healing Systems:自愈系统,异常检测 + 自动修复
- Multi-Cloud Governance:跨 AWS/GCP/Azure 多云治理
新增领域:OpenClaw Workspace 架构
OpenClaw workspace 文件体系通过 7 个核心文件实现 Agent 的可预期性和一致性。
核心文件
- AGENTS.md:岗位职责说明书(300-500 字最佳),定义边界而非仅列能力
- SOUL.md:性格档案(叙事性角色设定),与 IDENTITY.md 分工明确
- USER.md:用户偏好固化,减少重复交代
- TOOLS.md:工具权限规范,核心是"什么时候不用"
- IDENTITY.md:结构化身份元数据(Name/Creature/Vibe/Emoji/Avatar)
- BOOTSTRAP.md:一次性初始化引导,完成后删除
- 长期记忆:memory/ 目录,Agent 跨会话保留重要信息
核心价值
从"每次重新 onboarding"转变为"记得上下文、偏好和历史"的长期搭档。
新增领域:家庭监控方案(可观测性实践)
家庭和小型实验室场景下,通过 Docker 一键部署完整监控栈,实现主机/容器/服务三层覆盖。
核心组件
- Prometheus:时序数据库和告警规则引擎,pull 模式采集所有 exporter 指标
- Grafana:仪表盘可视化,Dashboard ID 1860/14282/7587 覆盖主要监控需求
- cAdvisor:容器指标采集,挂载 /var/lib/docker/ 获取完整容器资源数据
- blackbox_exporter:HTTP/TCP/DNS/TLS 黑盒探测,监控内外网服务可用性
- node_exporter:主机指标采集,CPU/内存/磁盘/网络
- Alertmanager:告警分组抑制分发,支持邮件/Slack/Telegram
关键告警
- HostHighCPU:CPU 5分钟平均 > 85%
- HostLowDisk:磁盘剩余 < 10%
- TLSCertExpiring:证书到期 < 14天
- HTTPProbeFailed:探测连续失败
扩展路径
- Loki + Promtail:日志聚合
- Uptime Kuma:轻量合成探针 UI
- VictoriaMetrics:长期时序存储
关键洞察
- Docker Socket 挂载存在安全风险,容器可获宿主机 root 等同权限
- 监控流量建议放在管理 VLAN 或防火墙限定访问
新增领域:Synology NAS 影视媒体平台
群晖 NAS 作为自托管媒体中心,整合阿里云盘资源与 Plex 前端,构建私有影视平台。
核心组件
- Plex:跨平台媒体服务器,自动刮削 TMDB/TVDB 元数据,支持转码和多设备播放
- Xiaoya Alist:阿里云盘资源聚合,通过 token 授权转存分享资源到阿里云盘
- CloudDrive2:群晖套件,将阿里云盘挂载为本地文件系统
- Synology NAS:硬件平台,Container Manager(Docker)和套件中心两大应用入口
离线镜像导入
当 Container Manager 无法读取 Docker Hub 时,通过 docker save/docker load 在离线环境迁移镜像。
媒体目录策略
aliyun-movie/ → Plex 电影库 aliyun-tvshows/ → Plex 电视剧库 aliyun-documentory/ → Plex 纪录片库
阿里云盘配置
- refresh_token:通过 alist.nn.ci/tool/aliyundrive/request.html 扫码获取
- token:阿里云盘 App 扫码授权
- 安全原则:仅授权资源目录,不授权备份目录
新增领域:电商数据采集与AI处理自动化
基于 Scrapy + Playwright + n8n + Ollama 构建全链路电商数据采集与 AI 处理管线。
核心架构
- Scrapy:异步结构化抓取,分页调度,支持 JSON/CSV 输出
- Playwright:JS 动态页面渲染,scrapy-playwright 插件集成
- n8n Workflow自动化:Cron 触发 → 执行爬虫 → 读取 JSON → AI 处理 → 存储 → 通知
- Ollama:本地 LLM 推理,http://localhost:11434/api/generate 调用
采集字段
title/price/rating/image_urls/product_url
AI 处理任务
- 内容摘要(30字内)
- 分类(类目/品牌/价格区间)
- 特征提取(品牌、型号、规格)
- 多语言翻译
- 异常检测(异常价格/缺图)
防封策略
- User-Agent 轮换
- 代理池(BrightData/ScraperAPI)
- DOWNLOAD_DELAY + 随机化
扩展路径
- FastAPI 服务层:REST API 暴露给前端/BI
- LangChain + Qdrant:向量语义检索
- Grafana/Metabase:电商趋势可视化
新增领域:Last30Days 与多平台热点聚合
Last30Days 研究过去 30 天内多平台社交热点,生成聚合研究报告,覆盖 Reddit/X/YouTube/TikTok/Instagram/Hacker News/Polymarket/Web 8 大数据源。
核心机制
- 多平台热点聚合:整合 8 个数据源的结构化趋势研究方法,权重分层(Reddit/X > YouTube > Polymarket > TikTok > Instagram > Web)
- 社交信号权重:基于真实互动(upvotes/likes/押注)而非单纯曝光量的热度评估框架
- 对比模式("A vs B")一次返回并排对比研究
- ScrapeCreators API 覆盖 Reddit/TikTok/Instagram(前 100 次免费)
API Keys 配置
- SCRAPECREATORS_API_KEY(必填)
- XAI_API_KEY 或 AUTH_TOKEN+CT0(X 搜索)
- OPENROUTER_API_KEY / TAVILY_API_KEY(Web 搜索备选)
最佳实践
- 测试话题:--quick(8-12 条/来源,2 分钟内)
- 深度研究:--deep(50-70 条 Reddit,40-60 条 X,2-8 分钟)
- 指定 X 账号:--x-handle=账号名(搜索特定人物/品牌帖子)
新增领域:gog CLI 与 Google Workspace CLI
gog CLI 是 macOS 系统通过命令行管理 Google Workspace 的工具,支撑日历/邮件自动化工作流。
核心机制
- Google Workspace CLI:命令行管理 Gmail/Calendar/Drive/Contacts/Docs/Sheets
- OAuth 双层验证:OAuth 凭证(身份认证)+ Google Cloud API Enablement(权限控制)
- 403 accessNotConfigured 错误的根因是 Google Cloud 项目未启用对应 API,而非权限问题
关键使用规范
- 添加测试用户(ishenwei@gmail.com)绕过 Google 第三方应用验证限制
- 启用新 API 后必须重新授权(gog auth revoke && gog auth login)
- export GOG_ACCOUNT=ishenwei@gmail.com 设置默认账号
新增领域:Cursor 2.0 与 AI代码编辑器
Cursor 2.0 是基于 VS Code 的 AI 代码编辑器,通过 Composer模型 和多代理并行机制提升编程效率。
核心机制
- AI代码编辑器:集成 AI 辅助的代码编辑器(Cursor/Windsurf/Trae/Cline),AI 代理 + Diff 审查 + 项目规则
- Composer模型:Cursor 自研 AI 生成模型,生成速度比同类快 4 倍
- 多代理并行:Plan/Agent/Ask 三种模式同时运行不同任务,互不干扰
- Diff审查:逐文件对比 AI 生成代码,强制先测试再确认
三种代理模式
- Plan 模式:AI 规划任务步骤,不修改代码
- Agent 模式:自动串联 MCP 工具链,修改代码
- Ask 模式:仅返回文本答案,不修改代码(最安全)
关键规范
新增领域:n8n Docker 部署与网络代理配置
n8n 自托管工作流引擎通过 Docker 部署在 Ubuntu2(192.168.3.45),通过 SOCKS5 代理解决容器内访问外网问题。
核心组件
- Docker Compose:n8n 容器编排,定义环境变量、端口映射和数据卷
- SOCKS5代理:ALL_PROXY 环境变量将容器内 HTTP/HTTPS 流量转发到宿主机代理
- 容器内测试代理:curl --socks5 172.18.0.1:10808 https://ifconfig.me
关键能力
新增领域:Cloud Operating Model 云运营模型
企业级云运营模型(COM)通过四大支柱和六步设计法,为组织提供云投资有效管理、安全运营和可持续优化的标准化框架。
核心机制
- Cloud Operating Model:四大支柱(治理/自动化/安全/FinOps),六步设计法(评估→治理→自动化→FinOps→安全→优化)
- FinOps:实时成本追踪,Reserved Instances 可节省 40-70% 计算成本
- Zero Trust:零信任安全模型,永不信任持续验证,最小权限原则
- 多云策略避免供应商锁定,Kubernetes 实现工作负载可移植性
关键洞察
- 89% 企业将在 2025 年采用云优先架构(Gartner),但缺乏结构化方法的组织面临成本失控和安全漏洞
- AI 驱动异常检测可使停机时间减少 45%
新增领域:MinIO + Zipline 自托管图床
Synology NAS 通过 Docker 部署 MinIO 对象存储 + Zipline 图片托管服务 + PostgreSQL 元数据,构建完全自控的私有图床。
核心组件
- MinIO:兼容 S3 协议的对象存储引擎,数据持久化在 NAS
- Zipline:图片上传 Dashboard + REST API,与 n8n Workflow 集成
- PostgreSQL备份:pg_dump 热备份 + Synology Hyper Backup 增量归档
- S3协议:MinIO 核心配置参数(S3_BUCKET/ENDPOINT/ACCESS_KEY/SECRET_KEY/REGION/FORCE_PATH_STYLE)
关键洞察
- 存储性能仅受 NAS 硬盘/SSD 限制
- pg_dump + Hyper Backup 是防数据不一致的标准方案
新增领域:Trae Remote SSH 远程开发
Trae AI 代码编辑器通过 Remote SSH 连接 Ubuntu 服务器,结合 Docker Attach 模式和 Bind Mount,实现远程服务器上的隔离开发环境。
核心机制
- Remote SSH:Trae 在服务器安装 Trae Server,所有编辑操作在远程执行
- Docker Attach模式:直接进入 Docker 容器内部启动编辑器,完全隔离环境
- Bind Mount:宿主机目录挂载容器内,代码修改实时生效
- SSH Config HostName 可填写 Tailscale IP,实现内网/外网无缝切换
关键洞察
- Git 凭证通过 SSH Agent 转发解决
- 文件权限(UID/GID)问题:容器内生成文件归属 root,需在 Dockerfile 中指定用户
新增领域:Claude Skills 完整资源图谱与流程工程
Anthropic 官方 Skills 仓库 github.com/anthropics/skills 突破 3.2 万收藏,标志着从"提示词工程"到"流程工程"的范式转移。Skills = 说明书 + SOP,将人类经验封装为可复用工作流。
核心资源
- Anthropic 官方仓库:办公自动化(Word/PDF/PPT/Excel)、开发者工具箱(MCP Server/Web 测试/Artifacts 构建)、创意类 Skill
- 三大 Awesome 仓库:ComposioHQ、VoltAgent、BehiSecc,系统性整理 LLM Skills 工作流
- 三大聚合站:skillsmp.com、aitmpl.com、claudemarketplaces.com,拿来即用的 Skills 集
关键洞察
- Skills 核心是流程而非提示词,Vibe Coding 的尽头也是 Skills
- 真正有价值的不是 Prompt 写得多花哨,而是谁能将 SOP 交给 AI 稳定执行
新增领域:NotebookLM 7 种应用场景
NotebookLM 通过 Source-Grounding 机制(严格限制知识库仅含上传文档)实现高精度回答,每个答案附带精确引文。
7 种应用场景
- 信息管理:上传 PDF/文章/YouTube 链接,AI 自动处理并支持交互问答
- 被动学习:Audio Overviews 将文档转化为双人 AI 对话音频,支持 Brief/Deep Dive/Critique/Debate 风格
- 即时专家:上传多源资料快速建立领域认知
- 编程辅助:上传官方文档,通过问答定位知识点,替代冗长教程
- 项目管理:集中所有会议记录和战略文档,AI 自动生成结构化路线图
- 软件更新对比:同时上传多个版本发布说明,AI 提取差异并列出带引文变更清单
- 法律文档审查:严格基于上传文档回答,每问必带引文
关键洞察
- Source-Grounding 是 NotebookLM 与通用 AI 的本质区别:知识受限但精度极高
- 引文追溯让每个答案可验证,解决通用 AI 幻觉问题
新增领域:Agentic AI UX 设计五原则
Agentic AI(行动型 AI)与 GenAI(生成型 AI)的根本区别在于:Agentic AI 能感知环境、决策、预判并自主行动,而非仅生成内容。
五大设计原则
- 透明度:可视化 AI 任务进度和推理过程摘要,帮助用户理解 AI 决策逻辑
- 控制权:提供明确的停止机制和操作撤销能力,确保用户始终掌控 AI 行为边界
- 个性化:基于用户历史行为预测未来需求,主动提供个性化建议
- 对话式设计:自然语言界面取代传统点击,用户意图以对话方式传达
- 预判式设计:AI 主动预判需求并提前行动,但保留用户调整 AI 自主性等级的控制权
关键洞察
- 用户通过观察 AI"思考"过程实现参与,而非直接操作界面
- AI 自主性 aggressiveness 可调节,需在主动服务与用户控制之间取得平衡
新增领域:OpenClaw 照片整理实战
通过 OpenClaw AI Agent 实现 28 万张照片的自动化整理,将"没有想清楚"的问题前置化。
核心方法
- 精确去重:MD5 哈希比对,只删真正相同的文件
- 小文件清理:低于 100KB 的图片(截图/微信压缩图)自动移走
- 安全删除:待删文件先移至 To-Be-Deleted 目录而非直接删除
- 分批执行:68 个目录拆为 8 批次,每天凌晨 0 点自动执行
- AI Agent 思维方式:先问关键问题(格式/重复定义/删除策略)而非直接动手
关键洞察
- AI Agent 核心价值不是单点能力提升,而是思维方式升级——将模糊想法变成清晰结构
- Telegram 推送每批次执行 Summary 报告,实现真正的无人值守
新增领域:AI 时代赚钱思维模型
"普通人怎么在AI时代赚钱"的框架是错的,正确的问题是"AI 让我能做到什么以前做不到的事"。
三大核心原则
- 品味:AI 工具民主化后,能判断什么是真正好的成为稀缺护城河
- 端到端:别做别人 AI 流水线上的螺丝钉,做从 idea 到 product 的完整闭环
- 死亡过滤器:每天问自己是否还愿意做这件事,筛选真正的热爱
关键洞察
- AI 不会让普通人变富,但会让那些知道自己要做什么、且对品质有执念的人变得极其强大
// 新增领域:baoyu-skills Claude Code 技能集(2026-04-15 PM) // 新增领域:Multi-Agent 虚拟团队协作模式(2026-04-15 PM) // 新增领域:Vibe-Kanban + OpenCode Ubuntu 部署(2026-04-15 PM) // 新增领域:Home Office 自托管服务三件套——MariaDB + Navidrome + rsync 增量备份(2026-04-15 Evening)
// 新增领域:n8n + Claude 自然语言工作流生成(2026-04-15 Night) // 新增领域:LLM Wiki vs RAG 的本质区别与持久化笔记系统(2026-04-15 Night) // 新增领域:一人公司 90 天跑通模式(2026-04-15 Night)
// 新增领域:Self-Improving + 双层记忆架构(2026-04-15 PM)
新增领域:baoyu-skills Claude Code 技能集
宝玉(JimLiu)发布的 Claude Code 技能集,通过 ClawHub 协议按单个 skill 安装,覆盖内容生成、AI 图像、日常效率工具三大类。
技能架构
- 内容技能:baoyu-xhs-images(小红书 9×6 风格布局)、baoyu-infographic(20×17 布局风格)、baoyu-cover-image(5维封面定制)、baoyu-slide-deck(4维度16预设)、baoyu-comic(5×8 画风基调)、baoyu-article-illustrator
- baoyu-imagine:9 家服务商自动选择(OpenAI/Google/Azure/OpenRouter/DashScope/MiniMax/即梦/豆包/Replicate),支持文生图/参考图/批量生成
- 工具技能:baoyu-translate(三模式翻译)、baoyu-youtube-transcript、baoyu-url-to-markdown、baoyu-x-to-markdown
发布协议
- ClawHub 按单个 skill 安装(clawhub install baoyu-imagine),而非 marketplace 批量安装
- EXTEND.md 支持用户级/项目级自定义,Env 配置支持 API Key 优先级覆盖
新增领域:Multi-Agent 虚拟团队协作模式
Solo founder 通过多 Agent 虚拟团队实现 24/7 全天候工作能力,每个 Agent 有独立角色/人格/模型,共享记忆,协作完成复杂任务。
核心机制
- 共享内存模式:GOALS.md(OKR 与优先级)+ DECISIONS.md(关键决策日志)+ PROJECT_STATUS.md(当前项目状态)
- 定时主动任务:Agent 主动在后台工作并推送结果,而非等待用户请求(早会摘要/指标推送/内容创意)
- Telegram路由:单群聊入口 + @AgentName 路由 + 无@默认 Lead Agent
- 从 2 Agent 开始,按瓶颈扩展,不是一上来建 4 个团队
实践案例
- Trebuh 的 4 Agent 团队(Milo/Josh/Marketing/Dev)+ Telegram + VPS,描述为"真正的 24/7 小团队"
新增领域:Vibe-Kanban + OpenCode Ubuntu 部署
Ubuntu Server 上通过 nvm 管理 Node 20,安装 Vibe-Kanban 与 OpenCode,pm2 管理进程,实现远程 AI 结对编程。
核心组件
- nvm:Node Version Manager(v0.39.7),安装和管理 Node 20
- Vibe-Kanban:AI 结对编程任务看板,Web UI(PORT 9999),自动 spawn OpenCode Executor
- pm2:进程管理器,pm2 start/logs/save/startup systemd
- OpenCode Executor:vibe-kanban spawn 的 AI 编程执行器,随机端口运行
关键约束
- 不要用 root 启动 OpenCode serve
- executor 随 vibe-kanban 进程一起管理,不单独用 pm2 管理
- I/O error 通常是 executor 没启动或端口被占用
新增领域:Home Office 自托管服务三件套
MariaDB 数据库
Synology NAS Docker 部署 MariaDB 10.11,通过 socket 本地登录管理,CREATE USER 创建远程访问账号。公网域名 mysql.ishenwei.online:63307 提供外网访问能力。
Navidrome 音乐服务器
Synology Docker 部署 Navidrome 开源音乐流媒体服务,音乐目录只读(:ro)挂载保护原始文件。ND_AUTOTRANSCODEDOWNLOAD 根据客户端能力自动转码,Subsonic API 兼容主流音乐 App。
rsync 增量备份自动化
rsync + NFS + /etc/fstab 永久挂载 + Crontab 凌晨 3 点自动化,构建"Clonezilla 整机镜像 + rsync 增量数据"二级保护体系。lockfile 防重入,mountpoint -q 防 NAS 掉线写爆本地硬盘。
核心概念
- Socket登录:MariaDB 本地连接方式
- NFS永久挂载:/etc/fstab + _netdev 等待网络就绪
- rsync增量备份:Delta-transfer 算法仅传输变化部分
- lockfile防重入:PID 文件 + kill -0 检测进程存活
新增领域:n8n + Claude 自然语言工作流生成
n8n 通过 MCP 协议与 Claude 连接,实现自然语言驱动的自动化工作流生成。
核心机制
- n8n-mcp:Claude 与 n8n 之间的 MCP 协议桥接,提供 543 个 n8n 节点的结构化访问
- AI工作流自动生成:Claude 生成 n8n 工作流 JSON 完成度约 80-90%,10-20% 错误率需人工修正
- 选择 Opensea 模型并开启 extended thinking 可显著提升生成质量
- n8n AI Agent 节点内置 Memory 机制,支持多轮对话上下文
关键区分
- Workflow vs Agent:预定义固定路径 vs LLM 动态决策
- Claude Code 的 delegate_task(Hermes 子 agent)vs terminal 调用 claude -p(MCP CLI 通道)
新增领域:LLM Wiki vs RAG 的本质区别与持久化笔记系统
通过 Obsidian + Gitea + OpenClaw 三层架构,将 AI 助手输出持久化为可积累的知识网络。
核心洞察
- LLM Wiki vs RAG:RAG 每次从零检索,知识不积累;LLM Wiki 让 AI 增量构建和维护持久化 Wiki,页面间互相链接
- AI 输出直接落盘到笔记(Obsidian)而非留在聊天记录,笔记通过 iCloud Drive 三端同步
- Gitea 提供 Git 版本管理,任何时候都能回溯历史版本
Obsidian 最佳实践
- Obsidian Web Clipper:浏览器插件快速采集外部素材
- Graph View:知识健康检查,发现孤岛页面和灰色幽灵节点(被引用但无专页的概念)
- Git自动同步:Auto commit-and-sync interval 完全自动化版本管理
- QMD:Wiki 规模到几百页后替代 index.md 提供精准搜索
知识管理原则
- 研究过程写入 Agent Archive(openclaw//)
- 经过验证可复用的知识沉淀到 Knowledge Base(knowledgebase/)
新增领域:一人公司 90 天跑通模式
从自我认知到商业变现,90 天跑通用最小杠杆撬动最大价值的一人公司。
核心框架
产品体系四层
- 引流(免费PDF)→ 入门(¥199 工具)→ 核心(¥4999 训练营)→ 高价(¥20000/月陪跑咨询)
- 价格锚定:高价咨询放顶部让低价显得便宜
- 内容矩阵:横轴核心主题 × 纵轴内容形式(观察/反直觉/操作指南/个人故事/清单)
- 反向金字塔:一次长形式内容切成无数微内容一次制作百次分发
四个心理陷阱
- 愧疚陷阱(不喜欢 = 别人也不喜欢)/ 效率陷阱(忙 = 创造价值)/ 卓越陷阱(必须亲自干)/ 努力陷阱(轻松 = 没价值)
新增领域:Self-Improving + 双层记忆架构
通过 self-improving skill + 双层记忆架构 + 每日定时复盘,实现 Agent 在错误中学习、持续进化,避免同一错误重复出现。
双层记忆架构
- 短期记忆:memory/YYYY-MM-DD.md 每日文件,每次 Session 启动时强制创建(解决记忆断层)
- 长期记忆:memory-lancedb-pro(LanceDB 向量数据库),语义搜索重要决策和偏好
- self-improving 层:LEARNINGS.md,Pattern-Key 追踪,Recurrence-Count 量化系统性
Self-Improving 核心机制
- Pattern-Key:经验记录唯一标识(如 cron.telegram-delivery),重复出现 = 系统性问题需系统性解决
- Recurrence-Count:重复次数计数器,≥2 说明这不是偶发错误
- 固定格式:Summary + Details + Suggested Action + Metadata(Pattern-Key/Recurrence-Count/See Also)
每日复盘
- 23:00 定时触发,读取当天 memory → self_improvement_log → 检查 Pattern-Key 重复 → 同步到长期记忆 → Telegram 摘要
- 发现机制:复盘时发现 3月27日无 memory 文件 → 推动"Session 启动时强制创建"流程优化
新增领域:多智能体可靠性架构(Alex Ewerlöf)
Alex Ewerlöf 提出的多智能体可靠性架构,将 LLM 视为分布式系统中不可靠组件而非拟人化智能体。
4 种架构模式
- Multi-Agent Hierarchy:Supervisor(规划器)+ Worker(工作者)+ Validator(验证器)三角色顺序协作,依赖图强制协作而非靠"喜欢"
- Multi-Agent Consensus:N 个模型独立响应同任务,多数票消除随机噪声(3 模型同谎言概率 0.8%),适合事实核查和分类
- Multi-Agent Adversarial Debate:Generator + Critic + Judge 三方对抗(法庭模型),Truth survives the fight,适合安全分析和代码审查
- Multi-Agent Knock-out:遗传算法启发的适应度淘汰制,最差代理被淘汰(cattle not pets),适合迭代式 Agent 工程
核心洞察
- 停止要求模型"小心",改为强制其"正确"(架构约束 > 情感化 prompt)
- LLM Sycophancy:过度迎合导致撒谎,多数投票可缓解
- 验证器可以是确定性代码(单元测试/JSON schema)而非 LLM
新增领域:Build Your Own X(费曼学习法实践)
build-your-own-x GitHub 项目通过"从零重建流行技术"来深度掌握编程,是费曼学习法在技术领域的系统性实践。
核心资源
- CodeCrafters:build-your-own-x 当前维护方,提供 codecrafters.io 在线编程挑战
- 25 个技术领域:3D Renderer / BitTorrent / Blockchain / Bot / Docker / Emulator / Git / Neural Network / OS / Regex / Search Engine / Web Browser 等
- 每个领域提供多语言实现(Python/JavaScript/Go/C++/Rust 等)
关键洞察
- "What I cannot create, I do not understand" — Richard Feynman
- BYOX 是 Vibe Coding 的底层实践,Vibe Coding 规划驱动,BYOX 从零实现
新增领域:Solo Founder 多 Agent 专精团队
Solo founder 通过多 Agent 虚拟团队实现 24/7 全天候工作能力,Multi-Agent Hierarchy 模式的具体 OpenClaw 实践。
团队配置模式
- Lead Agent(Milo):战略协调,制定计划,OKR 追踪
- Business Agent(Josh):数据分析,定价策略,竞品监控
- Marketing Agent:内容创意,Reddit/X 趋势监控
- Dev Agent:代码实现,技术架构,CI/CD
核心机制
- 定时主动任务:Agent 主动推送早会摘要/指标报告/内容创意,而非被动等待用户请求
- Telegram路由:单群聊 + @AgentName 路由 + 无@默认 Lead
- 2 Agent 起步按瓶颈扩展,而非一上来建 4 个团队
灵感来源
- Trebuh 的 4 Agent 实践("a real small team available 24/7")
- Nicholas Carlini 自主编码 Agent 方法论
新增领域:去中心化项目协调(STATE.yaml)
通过共享 STATE.yaml 文件替代中央 orchestrator,实现真正的并行 subagent 协作。
核心机制
- STATE.yaml:YAML 结构定义任务状态、owner、blocked_by、next_actions
- Git 作为审计日志:STATE.yaml 变更 commit 实现完整历史追溯
- 薄主会话原则:主 Agent 只做 spawn/send,不直接执行任务
与多 Agent 专精团队的关系
- 专精团队:多角色 Agent 并存,STATE.yaml 记录团队共享目标
- 去中心化协调:同一团队内无中央 orchestrator,各 Agent 自主读写状态
新增领域:东方人生智慧
道家、儒家、佛教经典箴言体系,补充西方哲学框架之外的人生哲学视角。
核心命题
- 空性智慧:一切有为法如梦幻泡影露水电,不执着于"自性"(金刚经)
- 绝处逢生:"行到水穷处,坐看云起时",困境即转机的东方智慧(王维)
- 知其不可奈何而安之若命:先尽人事,后听天命,接纳与行动的平衡(庄子)
- 和光同尘:收敛锋芒,不标新立异,与世无争以保全自身(老子/曾国藩)
与苏东坡视角的关系
- 一语点醒梦中人 与 su-dongpo-perspective 均属东方人生智慧,后者侧重苏东坡的文学与政治生涯视角