# 用 AI 把零散资料变成可复用的知识库 —— 从原始稿到公众号的自动化工作流

**副标题**：把 raw/ 里的每一份素材，变成结构化知识、内容包与长期增长的内容资产

---

## 封面图建议（可直接给设计/生成提示词）

Prompt（给图像生成模型）：

> 扁平化流程图风格：笔记、文件夹、机器人助手（AI）和公众号稿件从左到右排列，颜色清爽（蓝绿系），中间有箭头连接，风格扁平、现代、适合科技类公众号封面，文字区域留白，保持高分辨率 PNG。

---

## 导语（钩子）

你是不是遇到过这样的痛点：团队里有大量会议记录、研究笔记和创意草稿，但真正可以复用、检索并产出持续价值的“知识”却屈指可数？今天介绍一个可落地的思路：用 LLM 驱动的自动化同步（llm-wiki-sync），把 raw/ 目录里的原始素材，系统化为结构化 Wiki、内容包与可发布的公众号稿件。7 分钟读完，你就能知道如何开始落地。

在开始之前，必须说明两点来源与灵感：
- LLM Wiki 的概念直接受到了 Andrej Karpathy 的影响，他在这篇著名的 gist 中提出了把知识库交给大模型驱动并持续同步的思想：https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
- 我们的 llm-wiki-sync 正是基于现有的开源实现进行扩展与工程化改造，参考并基线于项目：https://github.com/SamurAIGPT/llm-wiki-agent（在此项目基础上我们加了工作流、Cron、Hermes skill 与企业化的同步策略）。

---

## 一、问题是什么（为什么要做）

- 原始素材散、格式乱：文件命名不规范、缺少摘要与元信息。  
- 知识难以复用：好内容写一次就扔，找不到历史背景与引用。  
- 人力成本高：每次写长文都要重新梳理背景与资料。  

目标：把“碎片化”信息变成“结构化”知识，支持快速写作、内容复用与团队协作。

---

## 二、什么是 LLM Wiki（以及我们所借鉴的工作）

**概念**：以 LLM（大模型）为执行引擎，把 raw/ 下的每份源文档转成结构化的 wiki 页面（Summary、Key Claims、Quotes、Connections、Entities），并维护索引与知识图谱。

如前所述，这一思路在社区已有经典表述：Andrej Karpathy 的 LLM Wiki 思路（见上文链接）强调把知识以可被模型直接消费的结构化碎片保存，从而让模型本身成为知识的持续维护者与“索引器”。我们在工程实现上参考并基线于 SamurAI 的 llm-wiki-agent 项目（链接见上文），在其之上做了：
- 企业化的 ingest 与审计流程（log、checkpoint、回滚）
- Hermes skill 封装（llm-wiki-sync），便于在本地/Telegram/CLI 调用
- 与静态站构建（Quartz）对接，支持把生成的 wiki 导出为页面网站以便分享和浏览

---

## 三、核心思路（3 步落地流程）

1. 统一入口：把所有原始资料放进 raw/ 目录（文件名用 kebab-case）  
2. 自动同步（llm-wiki-sync）：触发 ingest → 生成 wiki/sources/<slug>.md → 更新 wiki/index、overview 与 entities  
3. 导出内容包：由 agent（如 Marketing Content Creator）从 wiki 生成公众号稿、图文摘要与三条社媒文案

---

## 四、操作演示（可复制的实操步骤）

准备工作：
- 把文件放到 raw/，命名示例：raw/product-launch-2026.md  
- 确认 llm-wiki-sync skill 已部署（或用 hermes 提供的 sync 脚本）  

执行（示例命令/流程）：

1) 手动单篇 ingest（Hermes CLI）

```
hermes skill llm-wiki-sync ingest raw/product-launch-2026.md
```

2) 批量同步（Cron）

```
hermes cron create "every 6h" --prompt "sync raw/ to wiki/" --deliver=origin
```

3) 从 wiki 导出公众号初稿（示例）

```
hermes chat -q "从 wiki/sources/product-launch-2026.md 生成一篇适合微信公众号的 800 字文章，包含标题、导语、3 个要点与结尾 CTA。"
```

---

## 五、公众号稿件模版（可直接复制粘贴）

（此处为可直接发布的公众号稿，基于“Marketing Content Creator”角色与上述流程精炼而成）

**标题**：把零散资料变成可复用的“知识产品”——一套 LLM 驱动的实操方法  
**作者**：内容工程团队

**导语**：  
很多团队都有大量写过的会议纪要、研究报告和草稿，但这些资产很少转化为持续价值。本文将手把手教你，如何用一套 LLM 驱动的同步流程，把 raw/ 下的原始素材自动整理成结构化 Wiki，再一键生成可发布的公众号稿件、短视频脚本与社媒文案。

（正文略 — 与之前稿件内容一致，保留原结构：问题、方案、操作指南、CTA）

---

## 六、落地注意事项（工程与运营）

- 语言/格式规范：遵守团队的输出规范（比如 CLAUDE.md 里的简体中文与结构化语义规则）。  
- 并发与配额：同步任务避免并发过高，建议单文件顺序 ingest 或批次处理（每批 3–10 篇）。  
- 通知策略：cron 任务要设置 deliver=origin 才会在 Telegram/当前 chat 发送完成通知。  
- 媒体与图片：若原始文件含图片，先上传到公共可访问路径或把本地路径记录到 source 页面中。  
- 回滚与审计：每次 ingest 前建议在 git 或 checkpoint 做一次快照，出问题可回滚。

---

## 七、把 Wiki 导出成网站（用 Quartz 构建并分享）

在生成并维护好 wiki/ 内容之后，为了方便浏览与分享，我们会把 wiki 导出为静态网站。工程上我们使用 Quartz（https://github.com/jackyzha0/quartz）来做静态站构建：

- 流程概述：把 wiki/ 与 raw/ 的需要公开的页面同步到 quartz-source/，运行 npx quartz build → 输出 quartz/ 静态目录 → 部署到 GitHub Pages / Vercel / Netlify 或自托管服务器。  
- 优点：通过浏览器即可随时阅读知识库、把页面分享给同事或外部合作方，并保留 OG meta、搜索与交互式知识图谱（graph）。  
- 实操建议：在构建流水线中加入两次构建（第一次生成 artifacts 并暂存 raw，第二次最终构建），并在 CI 中做增量构建以节省时间（详见项目脚本或我可以帮你生成的 pipeline）。

---

## 八、结语（行动号召）

如果你准备好了，把你的一份 raw 文档发来（文件名或粘贴内容均可），我可以示范一次完整的 ingest → wiki → Quartz 构建 → 公众号初稿流程，现场出稿并给出可直接发布的文章与三条社媒文案。回复“演示 + 文件名”即可。

---

*注：本文在概念部分引用了 Karpathy 的 LLM Wiki 思路（链接见上文），工程实现基线使用了 SamurAI 的 llm-wiki-agent 开源项目，并用 Quartz 做最终的静态站构建与分享。*