Auto-sync: 2026-04-28 12:03

2026-04-28 12:03:10 +08:00
parent c898cc3fb9
commit f8b421ece6
45 changed files with 1739 additions and 1073 deletions
--- a/wiki/entities/@witcheer.md
+++ b/wiki/entities/@witcheer.md
@@ -0,0 +1,28 @@
+---
+title: "@witcheer"
+type: entity
+tags: [AI-Agent, Context-Management, OpenSource]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
+---
+
+## Basic Info
+- **Type**: 人物
+- **Platform**: Twitter/X @witcheer
+- **Role**: AI Agent 实践者与技术写作者
+
+## Summary
+在 Twitter/X 上系统分析 AI 记忆工具全景的作者。运营 24/7 Mac Mini M4 Agent 设置（持续运行、跨会话、多项目），独立完成了对 450+ 个 GitHub 仓库的系统梳理，将 AI 记忆工具领域划分为 Memory Backend（Camp 1）和 Context Substrate（Camp 2）两大阵营。
+
+## Credentials
+- 运营 24/7 Mac Mini M4 Agent 设置超过一年
+- 在持续运行场景中发现并验证了 Camp 1 / Camp 2 的分裂
+- 独立完成全景分析（most memory tools couldn't power what I'm doing）
+- 开发并维护 [[ALIVE]] 项目（alivecontext.com）
+
+## Key Contribution
+通过运行持续 Agent 设置，发现了大多数记忆工具无法支持的场景，并识别出真正能支撑该场景的架构（Context Substrate）根本没有被当作"记忆工具"来讨论。
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 作者 ← @witcheer 是本文档的作者
+- [[ALIVE]] ← 开发 ← @witcheer 开发并使用 ALIVE
--- a/wiki/entities/ALIVE.md
+++ b/wiki/entities/ALIVE.md
@@ -0,0 +1,38 @@
+---
+title: "ALIVE"
+type: entity
+tags: [AI-Memory, Context-Substrate, OpenSource, Agent-Agnostic]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
+---
+
+## Basic Info
+- **Type**: 产品 / AI Memory Tool
+- **Category**: Camp 2 — Context Substrate
+- **Website**: alivecontext.com
+- **Twitter**: @AliveContext_
+- **Author**: @witcheer（同时是 [[ai-memory-tools-two-camps]] 的作者）
+
+## Summary
+[[@witcheer]] 在自己的 24/7 Mac Mini M4 Agent 设置中使用的 Context Substrate 方案。结构化上下文基质，文件原生，Agent 无关。核桃（walnuts）作为便携上下文容器。零基础设施依赖，纯文件复合。
+
+## Core Philosophy
+- 零基础设施依赖（zero infrastructure dependencies）
+- 纯文件复合（plain files that compound）
+- Agent 无关（agent-agnostic）
+- 文件原生（file-native）
+
+## Author's Use Case
+@witcheer 在 Mac Mini M4 上运行 24/7 Agent 设置，在 Claude Code 和 Hermes Agent 上都使用 ALIVE——正是这种持续运行、多会话、多项目的场景，使得 ALIVE 成为 Context Substrate 价值的最佳验证。
+
+## What Makes ALIVE Different
+不同于其他 Camp 2 工具，ALIVE 的独特之处在于：
+- 由实际持续运行 Agent 的用户开发
+- 在真实的 24/7 设置中验证有效
+- 不依赖任何向量数据库或图数据库
+- 完全基于文件系统的积累机制
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 来源 ← ALIVE 是本文档中 @witcheer 推荐使用的 Context Substrate
+- [[Context-Substrate]] ← 属于 ← ALIVE 是 Context Substrate 范式的代表工具
+- [[@witcheer]] ← 由 ← @witcheer 开发并使用
--- a/wiki/entities/Grafana.md
+++ b/wiki/entities/Grafana.md
@@ -1,47 +1,34 @@
---
-title: "Grafana"
-type: entity
-tags: [visualization, monitoring, dashboards, observability]
-last_updated: 2026-04-26
---
-
-## Grafana — 可视化与告警平台
-
-**官方网址：** https://grafana.com/
-
-**类型：** 开源项目 / 可视化平台
-
-**别名：**
- Grafana OSS
- Grafana Labs
-
---
-
-## Overview
-
-Grafana 是开源的可视化和告警平台，支持从 Prometheus、VictoriaMetrics、Loki、InfluxDB、Elasticsearch 等多种数据源查询和展示时序数据，提供丰富的 Dashboard 模板和灵活的告警配置。
-
-**核心特性：**
- 多数据源支持（Prometheus、Elasticsearch、Loki、InfluxDB 等）
- Dashboard 即代码（JSON 导出 + Git 管理）
- 告警规则配置（支持邮件/Slack/PagerDuty 等通知渠道）
- 用户权限管理
- 插件生态
-
-**典型部署端口：** `3000`（默认 admin/admin）
-
-**常用 Dashboard ID：**
- Node Exporter Full: `1860`
- cAdvisor Container Metrics: `14282`
- Blackbox Exporter Probe: `7587`
-
---
-
-## Used By
- [[家庭监控方案-prometheus-grafana-node-exporter-cadvisor-blackbox]]
-
-## Related Sources
- [[家庭监控方案-prometheus-grafana-node-exporter-cadvisor-blackbox]]
- [[ctp-topic-60-monitor-aws-using-hyperscale-observability-with-grafana]]
- [[ctp-topic-42-grafana-observability-dashboard]]
- [[public-cloud-learning-sessions-observability-with-opentelemetry]]
+---
+title: "Grafana"
+type: entity
+tags: [visualization, monitoring, open-source]
+sources: [可自动化-可扩展-ai增强的电商数据采集与处理系统]
+last_updated: 2025-11-11
+---
+
+## Aliases
+- Grafana Labs
+- Grafana Dashboard
+
+## Summary
+开源数据可视化平台，支持多种数据源，可创建交互式仪表盘。
+
+## Description
+Grafana 是一款开源的可观测性平台，用于数据可视化和监控仪表盘。
+
+### 核心特性
+- 多数据源支持（Prometheus、PostgreSQL、InfluxDB）
+- 丰富的图表类型
+- 告警功能
+- 模板变量
+- 团队协作
+
+### 电商场景适用性
+连接 PostgreSQL，可视化电商产品趋势、价格分布、竞品对比等分析报表。
+
+## Use Cases
+- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]] — 数据可视化展示层
+
+## Connections
+- [[PostgreSQL]] — 读取电商数据进行可视化
+
--- a/wiki/entities/Honcho.md
+++ b/wiki/entities/Honcho.md
@@ -0,0 +1,30 @@
+---
+title: "Honcho"
+type: entity
+tags: [AI-Memory, Memory-Backend, Peer-Model, Async-Reasoning]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
+---
+
+## Basic Info
+- **Type**: 产品 / AI Memory Tool
+- **GitHub**: 2.4k stars
+- **Category**: Camp 1 — Memory Backend
+- **License**: AGPL-3.0（限制性）
+- **Infrastructure**: PostgreSQL + pgvector（自托管）
+
+## Summary
+将人和 Agent 视为统一模型中的对等体（peers）。后台异步推理服务从会话中推导每个对等体的心理洞察——不仅记住你说了什么，还在构建"你如何思考"的模型。
+
+## Core Features
+- 人和 Agent 统一对等体模型（unified peer model）
+- 后台异步推理服务（async reasoning service）
+- 从会话中推导心理洞察（psychological insights）
+- PostgreSQL + pgvector 基础设施
+
+## Key Insight
+Camp 1 中最接近关心"实体演进"而非仅"事实存储"的方案。
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 来源 ← Honcho 是 Camp 1 中架构最独特、最接近实体演化建模的工具
+- [[Memory-Backend]] ← 属于 ← Honcho 是 Memory Backend 范式的代表工具
--- a/wiki/entities/Mem0.md
+++ b/wiki/entities/Mem0.md
@@ -1,34 +1,35 @@
---
-title: "Mem0"
-type: entity
-tags: [ai-agent, memory, vector-db]
-last_updated: 2026-04-23
---
-
-## Overview
-GitHub 53.1k stars，Camp 1（Memory Backend）类别的领导者。为 AI 应用和 Agent 提供智能记忆层。
-
-## Architecture
-四核心操作：add、search、update、delete
-
-三层存储粒度：
- **User level**：跨所有会话的长期用户偏好和事实
- **Session level**：当前会话内的上下文
- **Agent level**：Agent 自身的元记忆
-
-检索机制：混合搜索（语义 + 关键词）
-
-## Strengths
- 集成最简单：Python + TypeScript SDK
- 工作流程清晰：add → search → update → delete
- 与任何 LLM 兼容
-
-## Limitations
- 记忆条目是**扁平**的，条目之间没有关系
- 提取质量完全依赖 LLM extraction prompt
- 事实存入后不进化，1月的事实和4月的事实共存
- 无法真正"复合增长"——只是累积条目
-
-## Aliases
- Mem0
- mem0
+---
+title: "Mem0"
+type: entity
+tags: [AI-Memory, Memory-Backend, Vector-DB, OpenSource]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
+---
+
+## Basic Info
+- **Type**: 产品 / AI Memory Tool
+- **GitHub**: 53.1k stars
+- **Category**: Camp 1 — Memory Backend
+- **Website**: mem0.ai
+
+## Summary
+Camp 1（Memory Backend）类别的领导者。四个核心操作：add、search、update、delete。从对话中提取事实，存储在三层级（user、session、agent），通过混合搜索检索。
+
+## Core Features
+- 四操作 API：add、search、update、delete
+- 三层级存储：user（跨会话）、session（单次对话）、agent（Agent 间共享）
+- 混合搜索检索
+- Python + TypeScript SDK
+- 通用兼容设计
+
+## Key Limitation
+- 记忆是扁平条目，条目之间无关系
+- 每次提取都需要 LLM 调用，提取质量完全依赖提取提示词
+- 存储后不演进，一月的事实和四月的事实并存，无法自动处理新旧冲突
+
+## Why It's Camp 1
+Mem0 的核心问题域是"AI 应该记住什么？"，属于事实召回（fact recall）优化——系统从对话中提取事实并注入下一轮对话。
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 来源 ← Mem0 是 Camp 1 类别领导者
+- [[Memory-Backend]] ← 属于 ← Mem0 是 Memory Backend 范式的代表工具
--- a/wiki/entities/MemPalace.md
+++ b/wiki/entities/MemPalace.md
@@ -0,0 +1,40 @@
+---
+title: "MemPalace"
+type: entity
+tags: [AI-Memory, Memory-Backend, Local-First, Vector-DB, ChromaDB]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
+---
+
+## Basic Info
+- **Type**: 产品 / AI Memory Tool
+- **GitHub**: 46.2k stars
+- **Category**: Camp 1 — Memory Backend
+- **Website**: mempalace.app
+
+## Summary
+本地优先的逐字记忆工具。不同于提取事实，MemPalace 逐字存储对话并组织为 Wings（实体）、Rooms（主题）、Drawers（原始内容）结构，通过 ChromaDB 搜索。
+
+## Core Features
+- 本地优先架构（数据完全存储在本地）
+- 逐字存储对话（verbatim memory）
+- Wings/Rooms/Drawers 组织结构：
+  - **Wings**：实体（entities）
+  - **Rooms**：主题（topics）
+  - **Drawers**：原始内容
+- ChromaDB 向量搜索
+
+## Benchmark Results
+LongMemEval 基准测试结果：
+- 纯语义搜索（无 LLM）：**96.6%** 检索召回率
+- 混合管道：**98.4%**
+- LLM 重排：**99%+**
+
+## Key Limitation
+- 逐字存储线性增长——对话越多，占用越大
+- 无压缩、无综合
+- 擅长"找到三周前我说的话"，不适合"给我跨五个项目的当前工作状态"
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 来源 ← MemPalace 拥有 Camp 1 中最高 LongMemEval 基准
+- [[Memory-Backend]] ← 属于 ← MemPalace 是 Memory Backend 范式的代表工具
--- a/wiki/entities/Memsearch.md
+++ b/wiki/entities/Memsearch.md
@@ -1,31 +1,37 @@
 ---
-title: "memsearch"
+title: "MemSearch"
 type: entity
-tags: [tool, vector-search, open-source]
+tags: [AI-Memory, Context-Substrate, Markdown-First, Milvus, Hybrid-Search]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
 ---

-## Overview
-memsearch 是一个基于 Milvus 向量数据库的语义搜索 CLI/库，为 Markdown 文件提供语义搜索能力。由 ZillizTech 开发。
+## Basic Info
+- **Type**: 产品 / AI Memory Tool
+- **GitHub**: 1.2k stars
+- **Category**: Camp 2 — Context Substrate
+- **Infrastructure**: Milvus（Zilliz 团队）
+- **Website**: Zilliz 生态

-## Key Features
- 向量语义搜索 + BM25 全文搜索 + RRF 重排
- SHA-256 内容哈希实现增量索引
- 文件监控自动重索引
- 支持多种嵌入提供商：OpenAI、Google、Voyage、Ollama、本地模式
+## Summary
+来自 Milvus 团队（Zilliz）的 Markdown 优先记忆工具。记忆是 .md 文件，人类可读、可编辑、可版本控制。Milvus 作为"影子索引"从文件派生，完全可重建。

-## GitHub
-https://github.com/zilliztech/memsearch
+## Core Philosophy
+**文件是真相来源。向量搜索只是文件之上的访问层。**

-## Documentation
-https://zilliztech.github.io/memsearch/
+## Architecture
+- **第一层**：语义块（semantic chunks）
+- **第二层**：完整段落（full sections）
+- **第三层**：原始转录（raw transcripts）
+- 三层渐进披露（progressive disclosure）

-## Related Entities
- [[OpenClaw]] — 被 memsearch 增强的记忆系统
- [[Milvus]] — 底层向量数据库
- [[memsearch]] ← built_on ← [[Milvus]]
- [[memsearch]] ← enhances ← [[OpenClaw]]
+## Key Significance
+这个工具来自 Zilliz——向量数据库公司。他们交付的记忆系统中，他们自己的产品（Milvus）在文件下游。这是一个有意义的让步——承认了真相来源实际在哪里。

-## Related Concepts
- [[HybridSearch]] — memsearch 使用的搜索方法
- [[RRF-Reranking]] — memsearch 使用的重排机制
- [[IncrementalIndexing]] — memsearch 的索引优化
+## Hybrid Search
+- 稠密向量 + BM25 + RRF 重排（Reciprocal Rank Fusion）
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 来源 ← MemSearch 是文件优先哲学的典型代表
+- [[Context-Substrate]] ← 属于 ← MemSearch 是 Context Substrate 范式的代表工具
+- [[semantic-memory-search]] ← MemSearch 是 ← [[semantic-memory-search]] 的技术实现
--- a/wiki/entities/MinIO.md
+++ b/wiki/entities/MinIO.md
@@ -1,108 +1,34 @@
---
-title: MinIO
-type: entity
-tags: [docker, storage, s3, minio]
-date: 2025-12-29
---
-
-# MinIO
-
-## Aliases
- MinIO
- MinIO Server
-
-## Definition
-MinIO 是一个开源的 S3 兼容对象存储服务器，专为高性能、海量数据场景设计。作为 [[Zipline]] 图床系统的存储后端，MinIO 提供 S3 API 兼容接口，使应用无需修改即可对接。
-
-## Core Characteristics
-
-| 特性 | 说明 |
-|------|------|
-| 协议兼容 | S3 API（Amazon Simple Storage Service） |
-| 部署模式 | 单机 / 分布式（纠删码模式） |
-| 存储介质 | 直连磁盘，无特殊要求 |
-| 管理界面 | MinIO Console（默认端口 9001） |
-| API 端口 | 默认 9000 |
-| 授权协议 | AGPLv3 |
-
-## Architecture
-
-```
-[Application] --S3 API--> [MinIO Server] ---> [Disk/NAS Storage]
-     ^                              |
-     |______________________________|
-              MinIO Console (9001)
-```
-
-## Key Commands (mc CLI)
-
-```bash
-# 安装 MinIO Client
-wget https://dl.min.io/client/mc/release/linux-amd64/mc
-chmod +x mc
-
-# 设置 alias
-mc alias set local http://192.168.3.17:9000 admin StrongPasswordHere
-
-# 创建 bucket
-mc mb local/zipline-bucket
-
-# 匿名访问策略
-mc anonymous set public local/zipline-bucket    # 公共读写
-mc anonymous set download local/zipline-bucket   # 仅下载
-mc anonymous set upload local/zipline-bucket     # 仅上传
-mc anonymous set none local/zipline-bucket      # 禁用匿名
-
-# 查看 bucket 内容
-mc ls local/zipline-bucket
-```
-
-## Use Cases in Home Server
-
- [[Zipline]] 图床存储后端
- S3 兼容备份目标（替代 AWS S3）
- 私有云对象存储
- AI 模型权重文件存储
-
-## Docker Deployment
-
-```yaml
-minio:
-  image: minio/minio:latest
-  command: server /data --console-address ":9001"
-  environment:
-    MINIO_ROOT_USER: admin
-    MINIO_ROOT_PASSWORD: Abcd_1234
-  ports:
-    - "9000:9000"   # S3 API
-    - "9001:9001"   # Console
-  volumes:
-    - /volume1/docker/zipline-stack/minio/minio_data:/data
-  healthcheck:
-    test: ["CMD", "curl", "-f", "http://localhost:9000/minio/health/live"]
-    interval: 30s
-    timeout: 20s
-    retries: 3
-```
-
-## Performance Characteristics (vs Zipline)
-
-| 项目 | MinIO | Zipline |
-|------|-------|---------|
-| 存储性能 | 仅受 NAS 硬盘/SSD 限制 | 仅处理 metadata |
-| 并发 | 高（S3 原生并行） | 中等（单 Node.js 进程） |
-| 数据库 | 无（内置 KV） | PostgreSQL/SQLite |
-| 扩展性 | 可横向扩容 | 单实例 → 前端微服务 |
-| REST API | 完备 | 完备（适合 n8n） |
-
-## Connections
- [[Zipline]] ← stores files ← [[MinIO]]
- [[群晖 NAS]] ← hosts ← [[MinIO]]
- [[Docker堆栈]] ← part of ← [[MinIO]]
- [[mc命令]] ← manages ← [[MinIO]]
-
-## Related Concepts
- [[S3-兼容对象存储]]
- [[对象存储]]
- [[图床]]
- [[数据一致性]]
+---
+title: "MinIO"
+type: entity
+tags: [object-storage, s3-compatible, open-source]
+sources: [可自动化-可扩展-ai增强的电商数据采集与处理系统]
+last_updated: 2025-11-11
+---
+
+## Aliases
+- MinIO Object Storage
+- S3 兼容存储
+
+## Summary
+开源 S3 兼容的对象存储服务，用于存储图片和视频等非结构化数据。
+
+## Description
+MinIO 是一款高性能的开源对象存储服务，兼容 Amazon S3 API。
+
+### 核心特性
+- S3 API 完全兼容
+- 高性能（GB/s 级吞吐量）
+- 轻量级（单二进制文件）
+- 分布式部署支持
+- Docker 友好
+
+### 电商场景适用性
+替代云端 S3，存储爬取的电商产品图片和视频，降低云服务成本。
+
+## Use Cases
+- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]] — 图片和视频存储层
+
+## Connections
+- [[Scrapy]] — Scrapy ImagesPipeline 输出目标
+
--- a/wiki/entities/Ollama.md
+++ b/wiki/entities/Ollama.md
@@ -1,77 +1,39 @@
---
-title: "Ollama"
-type: entity
-tags: []
-last_updated: 2026-04-23
---
-
-# Ollama
-
-## Overview
-Ollama 是一个开源的本地大语言模型（LLM）运行框架，让用户可以在本地机器上部署和运行大型语言模型，实现**免费离线使用 LLM 能力**，同时确保私有数据的隐私和安全性。
-
-## Aliases
- Ollama
- ollama
-
-## Key Facts
- **官网**: https://ollama.com
- **中文站**: https://ollama.org.cn
- **GitHub**: https://github.com/ollama/ollama
- **支持平台**: macOS, Windows, Linux, Docker
- **API 端口**: localhost:11434
-
-## Supported Models
- DeepSeek-R1 系列（1.5B ~ 671B 参数）
- Qwen 系列
- Llama 系列
- 第三方模型（HuggingFace、魔塔社区）
-
-## Core Commands
-| 命令 | 功能 |
-|------|------|
-| `ollama run <model:size>` | 下载并运行模型 |
-| `ollama pull <model:size>` | 拉取模型 |
-| `ollama create <name> -f <Modelfile>` | 从 Modelfile 导入本地 GGUF 模型 |
-| `ollama list` | 列出所有已下载模型 |
-| `ollama ps` | 列出正在运行的模型 |
-| `ollama serve` | 启动 Ollama 服务 |
-
-## Hardware Requirements
-| 模型 | 建议内存 | 建议显存 | 适用场景 |
-|------|---------|---------|---------|
-| 1.5B | 4~8 GB | 4 GB | 轻量快速 |
-| 7B | 16 GB | 14 GB | 日常使用 |
-| 8B | 16 GB | 14 GB | 较高精度 |
-| 14B | 32 GB | 26 GB | 复杂任务 |
-| 32B | 64 GB | 48 GB | 专业级 |
-| 70B+ | 128+ GB | 140+ GB | 超大规模 |
-
-## Docker Deployment
-```bash
-# CPU 模式
-docker run -d -p 11434:11434 -v /data/ollama:/root/.ollama --name ollama ollama/ollama
-
-# GPU 模式
-docker run --gpus=all -d -p 11434:11434 -v /data/ollama:/root/.ollama --name ollama ollama/ollama
-```
-
-## Environment Variables
-| 变量 | 默认值 | 说明 |
-|------|--------|------|
-| OLLAMA_MODELS | ~/.ollama/models | 模型存储路径 |
-| OLLAMA_HOST | 127.0.0.1 | 服务绑定地址 |
-| OLLAMA_ORIGINS | * | 允许的来源域名 |
-
-## Key Concepts
- [[Local LLM Deployment]]：Ollama 是实现本地 LLM 部署的核心工具
- [[Docker LLM Deployment]]：Ollama 支持 Docker 部署模式
- [[Model Quantization]]：GGUF 格式量化模型可通过 `ollama create` 导入
-
-## Related Entities
- [[DeepSeek]]：Ollama 官方支持的深度求索推理模型
- [[Open WebUI]]：基于 Ollama API 的开源 Web 界面
- [[HuggingFace]]：第三方模型来源
-
-## Sources
- [[详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决-1]]
+---
+title: Ollama
+type: entity
+tags: [ollama, 本地大模型, 开源]
+last_updated: 2026-04-28
+---
+
+## Aliases
+- ollama
+- Ollama
+
+## Definition
+Ollama 是一款本地大模型运行时工具，支持通过单一命令安装、管理和运行开源 LLM（如 Qwen2.5-Coder、Llama、DeepSeek 等），提供 REST API 和多语言 SDK。
+
+## Key Facts
+- **官网**：https://ollama.com
+- **安装命令**：`curl -fsSL https://ollama.com/install.sh | sh`
+- **API 默认端口**：11434
+- **默认监听**：127.0.0.1（仅本地）
+- **远程访问配置**：设置 `OLLAMA_HOST=0.0.0.0` 环境变量
+- **GPU 支持**：安装 NVIDIA CUDA 后自动使用 GPU 加速，无需额外配置
+- **systemd**：安装后自动创建 systemd 服务，开机自启
+
+## Capabilities
+- CLI 交互模式：`ollama run <model>`
+- 模型管理：`ollama list`、`ollama rm <model>`、`ollama pull <model>`
+- REST API：`http://localhost:11434/api/chat`
+- Python SDK：`pip install ollama`
+- NodeJS SDK：`npm install ollama`
+
+## Used By
+- [[Open WebUI]] — ChatGPT 风格 Web 界面
+- [[n8n]] — AI 工作流自动化平台
+- [[LangChain]] — Agent 开发框架
+- [[OpenClaw]] — AI Coding Agent
+- [[Qwen2.5-Coder]] — 主要推荐运行模型之一
+
+## Sources
+- [[在-ubuntu-安装-ollama-并运行-qwen2-5‑coder-7b]]
--- a/wiki/entities/Playwright.md
+++ b/wiki/entities/Playwright.md
@@ -1,46 +1,35 @@
 ---
 title: "Playwright"
 type: entity
-tags: ["browser-automation", "web-scraping", "playwright", "javascript"]
-sources: ["marketing-carousel-growth-engine"]
-last_updated: 2026-04-26
+tags: [browser-automation, open-source, microsoft]
+sources: [可自动化-可扩展-ai增强的电商数据采集与处理系统]
+last_updated: 2025-11-11
 ---

-## Definition
-
-微软出品的浏览器自动化框架，支持 Chromium/Firefox/WebKit 多浏览器引擎。在 [[marketing-carousel-growth-engine]] 中用于抓取任意网站 URL，提取品牌信息和内容。
-
-## Key Details
-
- **Engine**: Playwright with Chromium（完整 JavaScript 渲染页面抓取）
- **Usage**: 导航目标 URL 及内部页面（pricing、features、about、testimonials）
- **Script**: `analyze-web.js` 执行完整业务研究，输出 `analysis.json`
- **Requires**: `playwright install chromium`
-
-## Output (analysis.json)
-
- **品牌提取**: 名称、Logo、配色、字体、Favicon
- **内容分析**: 标题、标语、功能、定价、客户评价、数据、CTA
- **内部页面导航**: pricing / features / about / testimonials
- **竞品检测**: 从网站内容识别 20+ 已知 SaaS 竞品
- **业务分类**: 业务类型和细分市场识别
- **钩子生成**: 针对细分市场的痛点钩子
- **视觉上下文**: 用于幻灯片生成的视觉参考定义
-
-## Usage in Carousel Growth Engine Pipeline
-
-```
-Phase 2: Research & Analyze
-  1. analyze-web.js → Playwright 完整分析目标 URL
-  2. 品牌提取（颜色/字体/Logo/Favicon）
-  3. 内容挖掘（功能/评价/定价/CTA）
-  4. 细分检测（业务类型分类）
-  5. 竞品映射（竞品识别）
-  ↓
-Phase 3: Generate & Verify
-  Gemini 根据 analysis.json 提示词生成幻灯片
-```
-
 ## Aliases
- Playwright
- playwright
+- Microsoft Playwright
+- playwright-python
+- playwright-node
+
+## Summary
+微软开源的浏览器自动化工具，支持 Chromium/Firefox/WebKit，提供可靠动态页面渲染能力。
+
+## Description
+Playwright 是微软开发的浏览器自动化框架，支持多种编程语言（Python、Node.js）。
+
+### 核心特性
+- 跨浏览器支持（Chromium、Firefox、WebKit）
+- 可靠等待机制，避免时序问题
+- 自动截图、PDF 生成
+- 无头模式和有头模式
+- 模拟移动端视图
+
+### 电商场景适用性
+解决 JavaScript 渲染页面的抓取问题（如电商网站的无限滚动、懒加载、登录墙）。
+
+## Use Cases
+- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]] — 动态页面渲染解决方案
+
+## Connections
+- [[Scrapy]] — scrapy-playwright 插件集成
+
--- a/wiki/entities/Qwen2.5-Coder.md
+++ b/wiki/entities/Qwen2.5-Coder.md
@@ -0,0 +1,43 @@
+---
+title: Qwen2.5-Coder
+type: entity
+tags: [qwen, qwen-coder, 通义千问, 代码大模型, 开源]
+last_updated: 2026-04-28
+---
+
+## Aliases
+- Qwen2.5-Coder
+- qwen2.5-coder
+- 通义千问代码模型
+- Qwen Coder
+
+## Definition
+Qwen2.5-Coder 是阿里云通义千问团队开发的代码专用大模型，参数规模覆盖 1.5B/3B/7B/14B/32B，其中 7B 版本约 4.5GB，擅长 Tool usage、Shell/Python/SQL 理解和 Repo 级代码理解。
+
+## Key Facts
+- **开发方**：阿里云通义千问（Qwen）团队
+- **适用场景**：DevOps automation、SQL Agent、Kubernetes troubleshooting、n8n workflow AI
+- **推荐配置**：CPU 8+ cores、RAM 16GB、NVIDIA GPU（可选）
+- **Ollama 模型名**：`qwen2.5-coder:7b`
+- **下载大小**：约 4.5GB
+- **对比优势**：相比普通 `qwen2.5:7b`，Tool usage 能力更强，Shell/Python/SQL 理解更深，Repo 级代码理解更优
+
+## Why Qwen2.5-Coder vs Qwen2.5
+| 能力 | qwen2.5-coder:7b | qwen2.5:7b |
+|------|-------------------|------------|
+| Tool usage | ✅ 强 | ⚠️ 一般 |
+| Shell/Python/SQL 理解 | ✅ 强 | ⚠️ 一般 |
+| Repo 级代码理解 | ✅ 强 | ⚠️ 一般 |
+| 通用对话 | ⚠️ 可用 | ✅ 强 |
+
+## Recommended Pairings
+| 工具 | 用途 |
+|------|------|
+| [[Open WebUI]] | ChatGPT 风格 Web UI |
+| [[n8n]] | AI 自动化工作流 |
+| [[LangChain]] | Agent 框架 |
+| [[OpenClaw]] | AI Coding Agent |
+| [[Ollama]] | 本地运行时 |
+
+## Sources
+- [[在-ubuntu-安装-ollama-并运行-qwen2-5‑coder-7b]]
--- a/wiki/entities/Scrapy.md
+++ b/wiki/entities/Scrapy.md
@@ -0,0 +1,35 @@
+---
+title: "Scrapy"
+type: entity
+tags: [python, crawler, open-source]
+sources: [可自动化-可扩展-ai增强的电商数据采集与处理系统]
+last_updated: 2025-11-11
+---
+
+## Aliases
+- Scrapy Framework
+
+## Summary
+Python 编写的开源爬虫框架，适合结构化数据抓取、分页调度、媒体下载和分布式部署。
+
+## Description
+Scrapy 是一个基于 Python 的开源网页爬虫框架，提供完整的数据爬取流程支持：请求调度、内容解析、数据清洗、管道存储。
+
+### 核心特性
+- 异步架构，性能高效
+- 内置选择器（CSS/XPath）
+- 插件生态丰富（scrapy-playwright、scrapy-redis）
+- 支持分布式部署（Scrapyd、Scrapy Cluster）
+- 内置 `ImagesPipeline` 媒体下载
+
+### 电商场景适用性
+适合批量抓取电商产品信息（标题、价格、描述、图片 URL），输出 JSON/CSV 格式供后续处理。
+
+## Use Cases
+- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]] — 数据采集层核心工具
+
+## Connections
+- [[Playwright]] — 动态页面渲染依赖
+- [[PostgreSQL]] — 数据存储目标
+- [[n8n]] — 自动化编排消费 Scrapy 输出
+
--- a/wiki/entities/Supermemory.md
+++ b/wiki/entities/Supermemory.md
@@ -0,0 +1,34 @@
+---
+title: "Supermemory"
+type: entity
+tags: [AI-Memory, Memory-Backend, Temporal-Awareness, OpenSource]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
+---
+
+## Basic Info
+- **Type**: 产品 / AI Memory Tool
+- **GitHub**: 21.8k stars
+- **Category**: Camp 1 — Memory Backend
+- **Website**: supermemory.ai
+
+## Summary
+明确定位"memory is not RAG"，差异化在于时间感知——说"我刚搬到旧金山"会自动覆盖旧城市信息，过期事实自动遗忘。用户画像结合稳定事实和近期活动，检索约 50ms。
+
+## Core Features
+- 时间感知：过期事实自动遗忘（temporal awareness）
+- 用户画像：稳定事实 + 近期活动结合
+- ~50ms 检索延迟
+- 连接器：Google Drive、Gmail、Notion、OneDrive、GitHub
+- 多模态支持：PDF、图片、视频、代码
+
+## Benchmark Claims
+- MemoryBench 基准框架（自创）
+- 声称在 LongMemEval、LoCoMo、ConvoMem 排名第一
+
+## Key Insight
+大多数 Camp 1 工具将事实视为永久存储。Supermemory 将其视为演进中的数据——这是 Camp 1 中最接近"状态管理"思维的方案。
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 来源 ← Supermemory 是 Camp 1 中时间感知最强、时间演进处理最完善的工具
+- [[Memory-Backend]] ← 属于 ← Supermemory 仍在 Memory Backend 范式内，但引入了状态演进思想
--- a/wiki/entities/Thoth.md
+++ b/wiki/entities/Thoth.md
@@ -0,0 +1,39 @@
+---
+title: "Thoth"
+type: entity
+tags: [AI-Memory, Context-Substrate, Knowledge-Graph, Dream-Cycle, FAISS]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
+---
+
+## Basic Info
+- **Type**: 产品 / AI Memory Tool
+- **GitHub**: 145 stars
+- **Category**: Camp 2 — Context Substrate
+- **Infrastructure**: FAISS
+
+## Summary
+小项目，但发现了整个领域中架构最深邃的方案之一。Thoth 构建了一个包含 10 种实体类型、由 67 种有向类型化关系连接的个人知识图谱。Dream Cycle 是夜间四阶段过程——重复合并、描述富化、关系推断、置信度衰减。
+
+## Core Architecture
+- 10 种实体类型
+- 67 种有向类型化关系（typed directional relations）
+- FAISS 向量搜索 + 每次 LLM 调用前一跳图扩展
+- 三层反污染机制防止跨实体事实串扰
+
+## Dream Cycle（四阶段夜间整合）
+1. **重复合并**：相似度 ≥ 0.93 的重复项合并
+2. **描述富化**：从对话上下文中丰富描述
+3. **关系推断**：推断共现实体之间的关系
+4. **置信度衰减**：超过 90 天的关系置信度衰减
+
+## Why Only 145 Stars
+因为需要用户认真对待 Camp 2 论点，肯为自己的上下文设置知识图谱——大多数人不愿意。大多数人想要一键安装的内存后端。
+
+## Worth Watching
+Thoth 的架构是整个 Camp 2 领域最接近自动化知识图谱构建和维护的方案，其反污染机制和置信度衰减是独特的创新。
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 来源 ← Thoth 是架构最深邃的 Camp 2 工具
+- [[Context-Substrate]] ← 属于 ← Thoth 是 Context Substrate 范式的代表工具
+- [[Dream-Cycle]] ← 实现 ← Thoth 实现了 Dream Cycle 四阶段夜间整合
--- a/wiki/entities/TrustGraph.md
+++ b/wiki/entities/TrustGraph.md
@@ -0,0 +1,39 @@
+---
+title: "TrustGraph"
+type: entity
+tags: [AI-Memory, Context-Substrate, Context-Cores, Version-Control, Knowledge-Graph]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
+---
+
+## Basic Info
+- **Type**: 产品 / AI Memory Tool
+- **GitHub**: 2.0k stars
+- **Category**: Camp 2 — Context Substrate
+- **Infrastructure**: Cassandra + Qdrant
+
+## Summary
+引入"Context Cores"概念——便携、带版本的上下文容器，包含领域 schema、知识图谱、向量嵌入、证据来源和检索策略。将上下文视为代码：版本化、测试、推动、回滚。
+
+## Core Innovation: Context Cores
+Context Cores 是 TrustGraph 的核心概念——将上下文作为第一等公民的制品（first-class artifact）：
+- 包含：领域 schema、知识图谱、向量嵌入、证据来源、检索策略
+- 可版本化（versioning）
+- 可测试（testable）
+- 可推动（promotable）
+- 可回滚（rollable back）
+
+## Conceptual Significance
+每个 Camp 1 工具将记忆视为对话的副作用。TrustGraph 将上下文视为第一等公民的制品，有身份（identity）、版本（version）和生命周期（lifecycle）。
+
+可操作价值：
+- 将 Context Core 交给新 Agent → 继承完整运营上下文
+- 分叉一个 Context Core 做实验 → 合并回主分支
+
+## Implementation Note
+实现较重（Cassandra + Qdrant），但概念模型是正确的方向。
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 来源 ← TrustGraph 引入了 Context Cores 概念
+- [[Context-Substrate]] ← 属于 ← TrustGraph 是 Context Substrate 范式的代表工具
+- [[Context-Cores]] ← 引入 ← TrustGraph
--- a/wiki/entities/Zep.md
+++ b/wiki/entities/Zep.md
@@ -0,0 +1,38 @@
+---
+title: "Zep"
+type: entity
+tags: [AI-Memory, Context-Substrate, Temporal-Knowledge-Graph, Graphiti, Enterprise]
+sources: [ai-memory-tools-two-camps]
+last_updated: 2026-04-15
+---
+
+## Basic Info
+- **Type**: 产品 / AI Memory Tool
+- **GitHub**: 4.4k stars
+- **Category**: Camp 2 — Context Substrate（从"Memory"重新品牌）
+- **Framework**: Graphiti（TKG 时间知识图谱）
+- **Compliance**: SOC2 Type 2, HIPAA
+- **Website**: getzep.com
+
+## Summary
+Zep 从"Memory"全面重新品牌定位为"Context Engineering"——这是整个领域最强的市场信号。融资公司看到领域走向，决定"Memory"是错误的词。底层使用时间知识图谱（Graphiti），事实包含 valid_at 和 invalid_at 时间戳，自动提取关系并返回预格式化上下文块。
+
+## Core Features
+- 时间知识图谱（Temporal Knowledge Graph via Graphiti）
+- valid_at / invalid_at 时间戳（事实的时间有效性）
+- 自动关系提取
+- 预格式化上下文块（优化 LLM 消费）
+- <200ms 检索延迟
+- SOC2 Type 2 + HIPAA 合规（企业级）
+
+## The Rebrand Signal
+Zep 从"memory"重塑品牌为"context engineering"是整个 AI 记忆工具领域最强的市场信号——一家有融资的公司选择放弃"Memory"这个词，表明他们看到了领域正在向 Context Substrate 方向演进。
+
+## Position in the Landscape
+Zep 在两个阵营之间架起了桥梁——仍然提取和检索，但在架构上最接近 Camp 2。他们的重新品牌化行为比任何技术实现都更能说明问题。
+
+## Connections
+- [[ai-memory-tools-two-camps]] ← 来源 ← Zep 的重新品牌化是领域最强市场信号
+- [[Context-Substrate]] ← 属于 ← Zep 被重新品牌定位为 Context Engineering
+- [[Context-Engineering]] ← Zep 重新品牌化为 ← Zep
+- [[ai-memory-tools-two-camps]] ← Zep ← 是 Camp 1/Camp 2 边界的跨越者
--- a/wiki/entities/kepano.md
+++ b/wiki/entities/kepano.md
@@ -1,31 +1,26 @@
---
-title: "kepano"
-type: entity
-tags: [obsidian, developer, skills]
-last_updated: 2026-04-21
---
-
-## Basic Info
- **Role**: Obsidian CEO / Founder
- **GitHub**: `kepano/obsidian-skills`
-
-## Aliases
- kepano
-
-## Key Contributions
-发布了 Obsidian 官方 Skills 仓库 (`kepano/obsidian-skills`)，包含以下 Skills：
-
-| Skill | 功能 | 推荐度 |
-|-------|------|--------|
-| [[Defuddle]] | 网页内容清洗，将杂乱 HTML 转为纯净 Markdown，支持 YouTube 字幕获取 | ✅ |
-| [[Obsidian-CLI]] | AI Agent 调用 Obsidian 官方 CLI，增删改查笔记 | ✅ |
-| [[Obsidian-Bases]] | 通过 .base 文件创建 Obsidian 动态数据库视图 | ✅ |
-| [[Obsidian-Markdown]] | 编写符合 Obsidian 规范的增强版 Markdown 文档 | ⚠️ |
-| [[Json-Canvas]] | 创建和编辑 Obsidian .canvas 白板文件（底层 JSON 语法） | ❌ |
-
-## Connections
- [[obsidian-必装-skills]] — 主要贡献者
- [[Obsidian]] — Obsidian 笔记软件创始人/CEO
- [[Defuddle]] — kepano 发布的 Skill
- [[Obsidian-CLI]] — kepano 发布的 Skill
- [[Obsidian-Bases]] — kepano 发布的 Skill
+---
+title: "kepano"
+type: entity
+tags: [obsidian, open-source]
+last_updated: 2026-04-28
+---
+
+## kepano（Obsidian CEO）
+
+### 简介
+kepano 是 Obsidian 笔记软件背后公司 Obsidian Privacy, LLC 的创始人和 CEO，同时也是 GitHub 仓库 `kepano/obsidian-skills` 的维护者。
+
+### 发布的 Skills
+kepano 维护的 obsidian-skills 仓库包含以下核心工具：
+
+- [[defuddle]]：网页内容清洗工具，通过剔除广告和导航栏来保留纯净 Markdown
+- [[obsidian-cli]]：让 AI Agent 直接调用 Obsidian 官方命令行工具
+- [[obsidian-bases]]：通过 .base 文件创建类似 Notion 数据库的动态视图
+- [[obsidian-markdown]]：符合 Obsidian 官方规范的增强版 Markdown 编写工具（⚠️ 不推荐）
+
+### 关键立场
+- 明确反对 OpenClaw 官方的 obsidian-skill（直接文件系统 I/O），认为 Token 消耗大且不稳定
+- 推荐使用官方 CLI 接口 obsidian-cli 作为 AI 与 Obsidian 通信的标准方式
+
+### Aliases
+- Obsidian CEO
--- a/wiki/entities/n8n.md
+++ b/wiki/entities/n8n.md
@@ -24,6 +24,7 @@ last_updated: 2026-05-01
 ## Sources
 - [[2025-年-11-个神级-ai-开源平替-github-杀疯了]]
 - [[n8n-workflow-orchestration]]
+- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]]
 - [[n8n-docker-install-update]]
 - [[n8n-full-tutorial-building-ai-agents-in-2025-for-beginners]]
 - [[n8n-claude-通过自然语言自动化工作流]]