nexus/openclaw/knowledgebase/Karpathy 最新分享：用 LLM 搭建个人知识库，告别 RAG 的低效循环.md

---
title: "Karpathy 最新分享：用 LLM 搭建个人知识库，告别 RAG 的低效循环"
source: "https://x.com/laozhang2579/status/2040732229035585615"
author:
  - "[[@laozhang2579]]"
published: 2026-03-26
created: 2026-04-09
description: "你以为把文档扔给 AI 让它检索就叫知识管理？Karpathy 说，那叫每次从零开始。几个小时前，Karpathy 在 GitHub 上发了一篇 Gist，提出了一个完全不同的思路：不是让 AI 被动检索，而是让 AI 主动帮你建一个 Wiki，持续更新、自动交叉引用、知识越积越..."
tags:
  - "clippings"
---
你以为把文档扔给 AI 让它检索就叫知识管理？Karpathy 说，那叫**每次从零开始**。

几个小时前，Karpathy 在 GitHub 上发了一篇 Gist，提出了一个完全不同的思路：不是让 AI 被动检索，而是让 AI 主动帮你建一个 Wiki，持续更新、自动交叉引用、知识越积越厚

你只用负责读和想，AI 负责整理和维护

今天老张就按照Karpathy这套方法，手把手教你在 Obsidian 里落地👇

# 一、Karpathy 核心洞察为什么 RAG 不够用？

大多数人用 AI 处理文档的方式是 RAG，例如通过NotebookLM、ChatGPT 文件上传一堆文件，问问题的时候 AI 临时检索相关片段，拼出一个答案，基本都是这个模式。

Karpathy 指出了这种方式的根本问题是**没有积累**。 每次提问，AI 都在从头搜寻知识。 问一个需要综合五篇文档的问题？AI 要每次现场找碎片、现场拼，什么都没沉淀下来。

他提出的替代方案叫 **LLM Wiki，**让 AI 增量地构建和维护一个持久化的 Wiki，其实就是互相链接的 Markdown 文件。

# 二、Karpathy的实战操作

## 2.1 用Chrome浏览器插件Obsidian Web Clipper 做素材采集

1、在浏览器安装 Obsidian Web Clipper 扩展

![图像](https://pbs.twimg.com/media/HFIfwbOagAEMQvo?format=jpg&name=large)

![图像](https://pbs.twimg.com/media/HFIf06pbwAEdvEg?format=png&name=large)

![图像](https://pbs.twimg.com/media/HFIf4qSbUAA0emo?format=png&name=large)

2、打开任意网页文章，点击扩展图标--Add to Obsidian

![图像](https://pbs.twimg.com/media/HFIgIcBb0AADVvi?format=jpg&name=large)

3、保存后文章自动转为 Markdown 出现在 Obsidian 里

![图像](https://pbs.twimg.com/media/HFIgeDibAAAVCaY?format=png&name=large)

## 2.2 一个快捷键，让图片本地化，告别外链失效

剪藏下来的文章，图片通常还是外链，过几个月链接一挂，文章就残了。更关键的是，AI 读不了挂掉的图片链接。 Karpathy 的方案是两步配置，一劳永逸：

**第一步：统一附件存储路径**

打开 设置 → 文件与链接 → 找到附件存储路径 → 设为当前文件夹下指定的子文件夹，子文件夹名称设为attachments 不推荐Karpathy的固定到一个目录 raw/assets/ 因为多了之后附件混在了一起不好管理。

![图像](https://pbs.twimg.com/media/HFIgqCpbgAEOV93?format=png&name=large)

**第二步：绑定下载快捷键** 设置 → 快捷键 → 搜索 "下载" → 绑定快捷键Ctrl+Shift+D

![图像](https://pbs.twimg.com/media/HFIgul2bQAAZjCZ?format=jpg&name=large)

以后每次剪藏完一篇文章，按一下 Ctrl+Shift+D，所有图片自动下载到本地。AI 就能直接读取和引用这些图片了

这里Karpathy分享了一个小细节：LLM 目前没法一次性读取带内嵌图片的 Markdown。变通做法是先让 AI 读文本内容，再让它单独查看文章引用的图片，不够优雅，但管用。

## 2.3 用图谱视图一眼看清知识库的全貌

Obsidian 的 **Graph View**是这套方法使你的所有 Wiki 页面以节点形式展示，页面之间的 双链 关系自动连线。打开方式：左侧边栏点击图谱图标或者用快捷键 Ctrl+G

![图像](https://pbs.twimg.com/media/HFIg0L4a8AAGgU_?format=jpg&name=large)

Karpathy把图谱视图结合AI用在两个场景：

1、**Lint 健康检查时** 一眼看出哪些页面是孤岛没有任何链接指向它，说明交叉引用缺失，需要让 AI 补上

2、**发现知识盲区** 如果某个概念被很多页面提到但自己没有独立页面，它在图谱里会显示为一个灰色的幽灵节点，提醒你应该让 AI 为它创建专页

## 2.4 用Dataview让 Wiki 自己生成报表（实用价值老张保留意见😂）

**Dataview** 是 Obsidian 的社区插件，它能对页面的 YAML frontmatter 做数据库式查询，自动生成动态表格和列表。 我觉得这个价值不大，只有多到一定程度或者想用元数据查询方式习惯的可以考虑，老张是直接用索引文件或者配合Claude 的文件检索 ,需要了无非在Prompt写的细一点 安装路径：设置 → 第三方插件→社区插件市场 → 搜索 "Dataview" → 安装并启用

![图像](https://pbs.twimg.com/media/HFIhHx2bUAAZKVZ?format=png&name=large)

配合 LLM Wiki 的用法是：让 AI 在每个 Wiki 页面的 frontmatter 里写上结构化元数据，比如：

```markdown
type: source
title: "文章标题"
date: 2026-04-05
tags: [AI, knowledge-base]
source_count: 3
```

然后你在任意页面写一段 Dataview 查询：

```markdown
TABLE title, date, tags
FROM "wiki/sources"
SORT date DESC
```

就会自动生成一个按日期倒序排列的来源列表，Wiki 页面越多，这个报表越有价值。

## 2.5 用 Marp 把Wiki 里的内容直接变成幻灯片（实用价值老张保留意见😂）

**Marp** 是一个基于 Markdown 的幻灯片格式，在 Obsidian 里装上 Marp Slides 插件就能直接预览和导出。 安装路径：设置 → 社区插件 → 搜索 "Marp Slides" → 安装并启用。

![图像](https://pbs.twimg.com/media/HFIhYqTboAAu1rq?format=jpg&name=large)

用法：在 Markdown 文件开头加上 marp: true，用 --- 分隔每页幻灯片，写完直接在 Obsidian 里预览，也可以导出为 PDF / HTML / PPTX。

![图像](https://pbs.twimg.com/media/HFIhdzfbUAAgJya?format=png&name=large)

配合 LLM Wiki 的场景，让 AI 从 Wiki 的某个主题页面直接生成 Marp 格式的幻灯片草稿，你微调后就能用。

## 2.6 知识库用Git做版本管理

操作步骤：设置 → 第三方插件 → 社区插件市场 → 搜索 "git" → 安装并启用

![图像](https://pbs.twimg.com/media/HFIhkfUbIAAGuLW?format=png&name=large)

如果你的 Vault 还不是一个 Git 仓库，需要初始化一次：

1、打开终端（Windows 用 PowerShell，Mac 用 Terminal），cd 到你的 Vault 目录 执行 git init 初始化仓库

![图像](https://pbs.twimg.com/media/HFIhqjbbMAEmCfp?format=png&name=large)

2、打开[github.com](https://github.com/) 创建一个private仓库

![图像](https://pbs.twimg.com/media/HFIhv6zacAAIKgd?format=jpg&name=large)

3、如果要同步到 GitHub，在 GitHub 上创建一个**私有仓库**（重要，知识库是私人数据），然后

```bash
git branch -M main
git remote add origin https://github.com/你的用户名/knowledge-bases.git
git add .
git commit -m "init: 初始化知识库"
git push -u origin main
```

![图像](https://pbs.twimg.com/media/HFIh_s6bYAAJteM?format=png&name=large)

安装完 Obsidian Git 插件后，打开它将Auto commit-and-sync interval设为10 分钟，插件会自动 commit + push，你完全不用管

![图像](https://pbs.twimg.com/media/HFIiEftacAAdhBo?format=png&name=large)

配好之后日常使用你不需要做任何事情。每隔几分钟插件自动 commit 和 push，相当于你的知识库有了一个**实时备份+完整历史**。

Git 对这套 LLM Wiki 方法来说是**必选项**，AI 批量改文件的能力越强，你越需要版本管理来兜底。

7\. 搜索利器：qmd 让 AI 精准定位知识

Wiki 规模小的时候，一个 index.md 目录文件就够 AI 导航了。但页面多了之后，需要真正的搜索能力。 Karpathy 推荐 **qmd**（[github.com/tobi/qmd](https://github.com/tobi/qmd)），一个完全本地运行的 Markdown 搜索引擎 对于咱们大多数人，Wiki 到几百个页面之前 index.md 完全够用。等你觉得 AI 找东西变慢了，再接入 qmd 也不迟。

# 三、为什么这套方法有效？

Karpathy 的原话很到位 维护知识库最痛苦的不是阅读和思考，而是**记录**。更新交叉引用、保持摘要最新、标注新旧矛盾、维护几十个页面的一致性。人类放弃 Wiki 是因为维护成本的增长速度超过了价值的增长速度。 但是AI 不会厌倦，不会忘记更新交叉引用，一次操作可以碰十五个文件。维护成本趋近于零，知识库就能真正活下去。

**思想精髓：** 你把精力放在 选素材、定方向、问好问题、思考意义，AI 负责其他一切。

其实老张觉得 Obsidian Web Clipper + 图片本地化附件热键 + Git + Claude 就够了，完全可以打造和Karpathy一样的RAG知识库，与Claude集成看这篇

> 3月26日

Karpathy的llm-wiki链接：[https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f](https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f)

以上就是老张经过自己实操分享的内容，如果你喜欢，欢迎点赞 、关注 + 转发！