Files
nexus/openclaw/knowledgebase/Karpathy 最新分享:用 LLM 搭建个人知识库,告别 RAG 的低效循环.md
2026-04-09 09:15:33 +08:00

168 lines
9.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: "Karpathy 最新分享:用 LLM 搭建个人知识库,告别 RAG 的低效循环"
source: "https://x.com/laozhang2579/status/2040732229035585615"
author:
- "[[@laozhang2579]]"
published: 2026-03-26
created: 2026-04-09
description: "你以为把文档扔给 AI 让它检索就叫知识管理Karpathy 说那叫每次从零开始。几个小时前Karpathy 在 GitHub 上发了一篇 Gist提出了一个完全不同的思路不是让 AI 被动检索,而是让 AI 主动帮你建一个 Wiki持续更新、自动交叉引用、知识越积越..."
tags:
- "clippings"
---
你以为把文档扔给 AI 让它检索就叫知识管理Karpathy 说,那叫**每次从零开始**。
几个小时前Karpathy 在 GitHub 上发了一篇 Gist提出了一个完全不同的思路不是让 AI 被动检索,而是让 AI 主动帮你建一个 Wiki持续更新、自动交叉引用、知识越积越厚
你只用负责读和想AI 负责整理和维护
今天老张就按照Karpathy这套方法手把手教你在 Obsidian 里落地👇
# 一、Karpathy 核心洞察为什么 RAG 不够用?
大多数人用 AI 处理文档的方式是 RAG例如通过NotebookLM、ChatGPT 文件上传一堆文件,问问题的时候 AI 临时检索相关片段,拼出一个答案,基本都是这个模式。
Karpathy 指出了这种方式的根本问题是**没有积累**。 每次提问AI 都在从头搜寻知识。 问一个需要综合五篇文档的问题AI 要每次现场找碎片、现场拼,什么都没沉淀下来。
他提出的替代方案叫 **LLM Wiki**让 AI 增量地构建和维护一个持久化的 Wiki其实就是互相链接的 Markdown 文件。
# 二、Karpathy的实战操作
## 2.1 用Chrome浏览器插件Obsidian Web Clipper 做素材采集
1、在浏览器安装 Obsidian Web Clipper 扩展
![图像](https://pbs.twimg.com/media/HFIfwbOagAEMQvo?format=jpg&name=large)
![图像](https://pbs.twimg.com/media/HFIf06pbwAEdvEg?format=png&name=large)
![图像](https://pbs.twimg.com/media/HFIf4qSbUAA0emo?format=png&name=large)
2、打开任意网页文章点击扩展图标--Add to Obsidian
![图像](https://pbs.twimg.com/media/HFIgIcBb0AADVvi?format=jpg&name=large)
3、保存后文章自动转为 Markdown 出现在 Obsidian 里
![图像](https://pbs.twimg.com/media/HFIgeDibAAAVCaY?format=png&name=large)
## 2.2 一个快捷键,让图片本地化,告别外链失效
剪藏下来的文章图片通常还是外链过几个月链接一挂文章就残了。更关键的是AI 读不了挂掉的图片链接。 Karpathy 的方案是两步配置,一劳永逸:
**第一步:统一附件存储路径**
打开 设置 → 文件与链接 → 找到附件存储路径 → 设为当前文件夹下指定的子文件夹子文件夹名称设为attachments 不推荐Karpathy的固定到一个目录 raw/assets/ 因为多了之后附件混在了一起不好管理。
![图像](https://pbs.twimg.com/media/HFIgqCpbgAEOV93?format=png&name=large)
**第二步:绑定下载快捷键** 设置 → 快捷键 → 搜索 "下载" → 绑定快捷键Ctrl+Shift+D
![图像](https://pbs.twimg.com/media/HFIgul2bQAAZjCZ?format=jpg&name=large)
以后每次剪藏完一篇文章,按一下 Ctrl+Shift+D所有图片自动下载到本地。AI 就能直接读取和引用这些图片了
这里Karpathy分享了一个小细节LLM 目前没法一次性读取带内嵌图片的 Markdown。变通做法是先让 AI 读文本内容,再让它单独查看文章引用的图片,不够优雅,但管用。
## 2.3 用图谱视图一眼看清知识库的全貌
Obsidian 的 **Graph View**是这套方法使你的所有 Wiki 页面以节点形式展示,页面之间的 双链 关系自动连线。打开方式:左侧边栏点击图谱图标或者用快捷键 Ctrl+G
![图像](https://pbs.twimg.com/media/HFIg0L4a8AAGgU_?format=jpg&name=large)
Karpathy把图谱视图结合AI用在两个场景
1、**Lint 健康检查时** 一眼看出哪些页面是孤岛没有任何链接指向它,说明交叉引用缺失,需要让 AI 补上
2、**发现知识盲区** 如果某个概念被很多页面提到但自己没有独立页面,它在图谱里会显示为一个灰色的幽灵节点,提醒你应该让 AI 为它创建专页
## 2.4 用Dataview让 Wiki 自己生成报表(实用价值老张保留意见😂)
**Dataview** 是 Obsidian 的社区插件,它能对页面的 YAML frontmatter 做数据库式查询,自动生成动态表格和列表。 我觉得这个价值不大只有多到一定程度或者想用元数据查询方式习惯的可以考虑老张是直接用索引文件或者配合Claude 的文件检索 ,需要了无非在Prompt写的细一点 安装路径:设置 → 第三方插件→社区插件市场 → 搜索 "Dataview" → 安装并启用
![图像](https://pbs.twimg.com/media/HFIhHx2bUAAZKVZ?format=png&name=large)
配合 LLM Wiki 的用法是:让 AI 在每个 Wiki 页面的 frontmatter 里写上结构化元数据,比如:
```markdown
type: source
title: "文章标题"
date: 2026-04-05
tags: [AI, knowledge-base]
source_count: 3
```
然后你在任意页面写一段 Dataview 查询:
```markdown
TABLE title, date, tags
FROM "wiki/sources"
SORT date DESC
```
就会自动生成一个按日期倒序排列的来源列表Wiki 页面越多,这个报表越有价值。
## 2.5 用 Marp 把Wiki 里的内容直接变成幻灯片(实用价值老张保留意见😂)
**Marp** 是一个基于 Markdown 的幻灯片格式,在 Obsidian 里装上 Marp Slides 插件就能直接预览和导出。 安装路径:设置 → 社区插件 → 搜索 "Marp Slides" → 安装并启用。
![图像](https://pbs.twimg.com/media/HFIhYqTboAAu1rq?format=jpg&name=large)
用法:在 Markdown 文件开头加上 marp: true用 --- 分隔每页幻灯片,写完直接在 Obsidian 里预览,也可以导出为 PDF / HTML / PPTX。
![图像](https://pbs.twimg.com/media/HFIhdzfbUAAgJya?format=png&name=large)
配合 LLM Wiki 的场景,让 AI 从 Wiki 的某个主题页面直接生成 Marp 格式的幻灯片草稿,你微调后就能用。
## 2.6 知识库用Git做版本管理
操作步骤:设置 → 第三方插件 → 社区插件市场 → 搜索 "git" → 安装并启用
![图像](https://pbs.twimg.com/media/HFIhkfUbIAAGuLW?format=png&name=large)
如果你的 Vault 还不是一个 Git 仓库,需要初始化一次:
1、打开终端Windows 用 PowerShellMac 用 Terminalcd 到你的 Vault 目录 执行 git init 初始化仓库
![图像](https://pbs.twimg.com/media/HFIhqjbbMAEmCfp?format=png&name=large)
2、打开[github.com](https://github.com/) 创建一个private仓库
![图像](https://pbs.twimg.com/media/HFIhv6zacAAIKgd?format=jpg&name=large)
3、如果要同步到 GitHub在 GitHub 上创建一个**私有仓库**(重要,知识库是私人数据),然后
```bash
git branch -M main
git remote add origin https://github.com/你的用户名/knowledge-bases.git
git add .
git commit -m "init: 初始化知识库"
git push -u origin main
```
![图像](https://pbs.twimg.com/media/HFIh_s6bYAAJteM?format=png&name=large)
安装完 Obsidian Git 插件后打开它将Auto commit-and-sync interval设为10 分钟,插件会自动 commit + push你完全不用管
![图像](https://pbs.twimg.com/media/HFIiEftacAAdhBo?format=png&name=large)
配好之后日常使用你不需要做任何事情。每隔几分钟插件自动 commit 和 push相当于你的知识库有了一个**实时备份+完整历史**。
Git 对这套 LLM Wiki 方法来说是**必选项**AI 批量改文件的能力越强,你越需要版本管理来兜底。
7\. 搜索利器qmd 让 AI 精准定位知识
Wiki 规模小的时候,一个 index.md 目录文件就够 AI 导航了。但页面多了之后,需要真正的搜索能力。 Karpathy 推荐 **qmd**[github.com/tobi/qmd](https://github.com/tobi/qmd)),一个完全本地运行的 Markdown 搜索引擎 对于咱们大多数人Wiki 到几百个页面之前 index.md 完全够用。等你觉得 AI 找东西变慢了,再接入 qmd 也不迟。
# 三、为什么这套方法有效?
Karpathy 的原话很到位 维护知识库最痛苦的不是阅读和思考,而是**记录**。更新交叉引用、保持摘要最新、标注新旧矛盾、维护几十个页面的一致性。人类放弃 Wiki 是因为维护成本的增长速度超过了价值的增长速度。 但是AI 不会厌倦,不会忘记更新交叉引用,一次操作可以碰十五个文件。维护成本趋近于零,知识库就能真正活下去。
**思想精髓:** 你把精力放在 选素材、定方向、问好问题、思考意义AI 负责其他一切。
其实老张觉得 Obsidian Web Clipper + 图片本地化附件热键 + Git + Claude 就够了完全可以打造和Karpathy一样的RAG知识库与Claude集成看这篇
> 3月26日
Karpathy的llm-wiki链接[https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f](https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f)
以上就是老张经过自己实操分享的内容,如果你喜欢,欢迎点赞 、关注 + 转发!