# 用 AI 把零散资料变成可复用的知识库 —— 从原始稿到公众号的自动化工作流 **副标题**:把 raw/ 里的每一份素材,变成结构化知识、内容包与长期增长的内容资产 --- ## 封面图建议(可直接给设计/生成提示词) Prompt(给图像生成模型): > 扁平化流程图风格:笔记、文件夹、机器人助手(AI)和公众号稿件从左到右排列,颜色清爽(蓝绿系),中间有箭头连接,风格扁平、现代、适合科技类公众号封面,文字区域留白,保持高分辨率 PNG。 --- ## 导语(钩子) 你是不是遇到过这样的痛点:团队里有大量会议记录、研究笔记和创意草稿,但真正可以复用、检索并产出持续价值的“知识”却屈指可数?今天介绍一个可落地的思路:用 LLM 驱动的自动化同步(llm-wiki-sync),把 raw/ 目录里的原始素材,系统化为结构化 Wiki、内容包与可发布的公众号稿件。7 分钟读完,你就能知道如何开始落地。 在开始之前,必须说明两点来源与灵感: - LLM Wiki 的概念直接受到了 Andrej Karpathy 的影响,他在这篇著名的 gist 中提出了把知识库交给大模型驱动并持续同步的思想:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f - 我们的 llm-wiki-sync 正是基于现有的开源实现进行扩展与工程化改造,参考并基线于项目:https://github.com/SamurAIGPT/llm-wiki-agent(在此项目基础上我们加了工作流、Cron、Hermes skill 与企业化的同步策略)。 --- ## 一、问题是什么(为什么要做) - 原始素材散、格式乱:文件命名不规范、缺少摘要与元信息。 - 知识难以复用:好内容写一次就扔,找不到历史背景与引用。 - 人力成本高:每次写长文都要重新梳理背景与资料。 目标:把“碎片化”信息变成“结构化”知识,支持快速写作、内容复用与团队协作。 --- ## 二、什么是 LLM Wiki(以及我们所借鉴的工作) **概念**:以 LLM(大模型)为执行引擎,把 raw/ 下的每份源文档转成结构化的 wiki 页面(Summary、Key Claims、Quotes、Connections、Entities),并维护索引与知识图谱。 如前所述,这一思路在社区已有经典表述:Andrej Karpathy 的 LLM Wiki 思路(见上文链接)强调把知识以可被模型直接消费的结构化碎片保存,从而让模型本身成为知识的持续维护者与“索引器”。我们在工程实现上参考并基线于 SamurAI 的 llm-wiki-agent 项目(链接见上文),在其之上做了: - 企业化的 ingest 与审计流程(log、checkpoint、回滚) - Hermes skill 封装(llm-wiki-sync),便于在本地/Telegram/CLI 调用 - 与静态站构建(Quartz)对接,支持把生成的 wiki 导出为页面网站以便分享和浏览 --- ## 三、核心思路(3 步落地流程) 1. 统一入口:把所有原始资料放进 raw/ 目录(文件名用 kebab-case) 2. 自动同步(llm-wiki-sync):触发 ingest → 生成 wiki/sources/.md → 更新 wiki/index、overview 与 entities 3. 导出内容包:由 agent(如 Marketing Content Creator)从 wiki 生成公众号稿、图文摘要与三条社媒文案 --- ## 四、操作演示(可复制的实操步骤) 准备工作: - 把文件放到 raw/,命名示例:raw/product-launch-2026.md - 确认 llm-wiki-sync skill 已部署(或用 hermes 提供的 sync 脚本) 执行(示例命令/流程): 1) 手动单篇 ingest(Hermes CLI) ``` hermes skill llm-wiki-sync ingest raw/product-launch-2026.md ``` 2) 批量同步(Cron) ``` hermes cron create "every 6h" --prompt "sync raw/ to wiki/" --deliver=origin ``` 3) 从 wiki 导出公众号初稿(示例) ``` hermes chat -q "从 wiki/sources/product-launch-2026.md 生成一篇适合微信公众号的 800 字文章,包含标题、导语、3 个要点与结尾 CTA。" ``` --- ## 五、公众号稿件模版(可直接复制粘贴) (此处为可直接发布的公众号稿,基于“Marketing Content Creator”角色与上述流程精炼而成) **标题**:把零散资料变成可复用的“知识产品”——一套 LLM 驱动的实操方法 **作者**:内容工程团队 **导语**: 很多团队都有大量写过的会议纪要、研究报告和草稿,但这些资产很少转化为持续价值。本文将手把手教你,如何用一套 LLM 驱动的同步流程,把 raw/ 下的原始素材自动整理成结构化 Wiki,再一键生成可发布的公众号稿件、短视频脚本与社媒文案。 (正文略 — 与之前稿件内容一致,保留原结构:问题、方案、操作指南、CTA) --- ## 六、落地注意事项(工程与运营) - 语言/格式规范:遵守团队的输出规范(比如 CLAUDE.md 里的简体中文与结构化语义规则)。 - 并发与配额:同步任务避免并发过高,建议单文件顺序 ingest 或批次处理(每批 3–10 篇)。 - 通知策略:cron 任务要设置 deliver=origin 才会在 Telegram/当前 chat 发送完成通知。 - 媒体与图片:若原始文件含图片,先上传到公共可访问路径或把本地路径记录到 source 页面中。 - 回滚与审计:每次 ingest 前建议在 git 或 checkpoint 做一次快照,出问题可回滚。 --- ## 七、把 Wiki 导出成网站(用 Quartz 构建并分享) 在生成并维护好 wiki/ 内容之后,为了方便浏览与分享,我们会把 wiki 导出为静态网站。工程上我们使用 Quartz(https://github.com/jackyzha0/quartz)来做静态站构建: - 流程概述:把 wiki/ 与 raw/ 的需要公开的页面同步到 quartz-source/,运行 npx quartz build → 输出 quartz/ 静态目录 → 部署到 GitHub Pages / Vercel / Netlify 或自托管服务器。 - 优点:通过浏览器即可随时阅读知识库、把页面分享给同事或外部合作方,并保留 OG meta、搜索与交互式知识图谱(graph)。 - 实操建议:在构建流水线中加入两次构建(第一次生成 artifacts 并暂存 raw,第二次最终构建),并在 CI 中做增量构建以节省时间(详见项目脚本或我可以帮你生成的 pipeline)。 --- ## 八、结语(行动号召) 如果你准备好了,把你的一份 raw 文档发来(文件名或粘贴内容均可),我可以示范一次完整的 ingest → wiki → Quartz 构建 → 公众号初稿流程,现场出稿并给出可直接发布的文章与三条社媒文案。回复“演示 + 文件名”即可。 --- *注:本文在概念部分引用了 Karpathy 的 LLM Wiki 思路(链接见上文),工程实现基线使用了 SamurAI 的 llm-wiki-agent 开源项目,并用 Quartz 做最终的静态站构建与分享。*