Auto-sync: 2026-04-28 12:03

This commit is contained in:
2026-04-28 12:03:10 +08:00
parent c898cc3fb9
commit f8b421ece6
45 changed files with 1739 additions and 1073 deletions

View File

@@ -0,0 +1,28 @@
---
title: "@witcheer"
type: entity
tags: [AI-Agent, Context-Management, OpenSource]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Basic Info
- **Type**: 人物
- **Platform**: Twitter/X @witcheer
- **Role**: AI Agent 实践者与技术写作者
## Summary
在 Twitter/X 上系统分析 AI 记忆工具全景的作者。运营 24/7 Mac Mini M4 Agent 设置(持续运行、跨会话、多项目),独立完成了对 450+ 个 GitHub 仓库的系统梳理,将 AI 记忆工具领域划分为 Memory BackendCamp 1和 Context SubstrateCamp 2两大阵营。
## Credentials
- 运营 24/7 Mac Mini M4 Agent 设置超过一年
- 在持续运行场景中发现并验证了 Camp 1 / Camp 2 的分裂
- 独立完成全景分析most memory tools couldn't power what I'm doing
- 开发并维护 [[ALIVE]] 项目alivecontext.com
## Key Contribution
通过运行持续 Agent 设置发现了大多数记忆工具无法支持的场景并识别出真正能支撑该场景的架构Context Substrate根本没有被当作"记忆工具"来讨论。
## Connections
- [[ai-memory-tools-two-camps]] ← 作者 ← @witcheer 是本文档的作者
- [[ALIVE]] ← 开发 ← @witcheer 开发并使用 ALIVE

38
wiki/entities/ALIVE.md Normal file
View File

@@ -0,0 +1,38 @@
---
title: "ALIVE"
type: entity
tags: [AI-Memory, Context-Substrate, OpenSource, Agent-Agnostic]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Basic Info
- **Type**: 产品 / AI Memory Tool
- **Category**: Camp 2 — Context Substrate
- **Website**: alivecontext.com
- **Twitter**: @AliveContext_
- **Author**: @witcheer(同时是 [[ai-memory-tools-two-camps]] 的作者)
## Summary
[[@witcheer]] 在自己的 24/7 Mac Mini M4 Agent 设置中使用的 Context Substrate 方案。结构化上下文基质文件原生Agent 无关。核桃walnuts作为便携上下文容器。零基础设施依赖纯文件复合。
## Core Philosophy
- 零基础设施依赖zero infrastructure dependencies
- 纯文件复合plain files that compound
- Agent 无关agent-agnostic
- 文件原生file-native
## Author's Use Case
@witcheer 在 Mac Mini M4 上运行 24/7 Agent 设置,在 Claude Code 和 Hermes Agent 上都使用 ALIVE——正是这种持续运行、多会话、多项目的场景使得 ALIVE 成为 Context Substrate 价值的最佳验证。
## What Makes ALIVE Different
不同于其他 Camp 2 工具ALIVE 的独特之处在于:
- 由实际持续运行 Agent 的用户开发
- 在真实的 24/7 设置中验证有效
- 不依赖任何向量数据库或图数据库
- 完全基于文件系统的积累机制
## Connections
- [[ai-memory-tools-two-camps]] ← 来源 ← ALIVE 是本文档中 @witcheer 推荐使用的 Context Substrate
- [[Context-Substrate]] ← 属于 ← ALIVE 是 Context Substrate 范式的代表工具
- [[@witcheer]] ← 由 ← @witcheer 开发并使用

View File

@@ -1,47 +1,34 @@
---
title: "Grafana"
type: entity
tags: [visualization, monitoring, dashboards, observability]
last_updated: 2026-04-26
---
## Grafana — 可视化与告警平台
**官方网址:** https://grafana.com/
**类型:** 开源项目 / 可视化平台
**别名:**
- Grafana OSS
- Grafana Labs
---
## Overview
Grafana 是开源的可视化和告警平台,支持从 Prometheus、VictoriaMetrics、Loki、InfluxDB、Elasticsearch 等多种数据源查询和展示时序数据,提供丰富的 Dashboard 模板和灵活的告警配置。
**核心特性:**
- 多数据源支持Prometheus、Elasticsearch、Loki、InfluxDB 等)
- Dashboard 即代码JSON 导出 + Git 管理)
- 告警规则配置(支持邮件/Slack/PagerDuty 等通知渠道)
- 用户权限管理
- 插件生态
**典型部署端口:** `3000`(默认 admin/admin
**常用 Dashboard ID**
- Node Exporter Full: `1860`
- cAdvisor Container Metrics: `14282`
- Blackbox Exporter Probe: `7587`
---
## Used By
- [[家庭监控方案-prometheus-grafana-node-exporter-cadvisor-blackbox]]
## Related Sources
- [[家庭监控方案-prometheus-grafana-node-exporter-cadvisor-blackbox]]
- [[ctp-topic-60-monitor-aws-using-hyperscale-observability-with-grafana]]
- [[ctp-topic-42-grafana-observability-dashboard]]
- [[public-cloud-learning-sessions-observability-with-opentelemetry]]
---
title: "Grafana"
type: entity
tags: [visualization, monitoring, open-source]
sources: [可自动化-可扩展-ai增强的电商数据采集与处理系统]
last_updated: 2025-11-11
---
## Aliases
- Grafana Labs
- Grafana Dashboard
## Summary
开源数据可视化平台,支持多种数据源,可创建交互式仪表盘。
## Description
Grafana 是一款开源的可观测性平台,用于数据可视化和监控仪表盘。
### 核心特性
- 多数据源支持Prometheus、PostgreSQL、InfluxDB
- 丰富的图表类型
- 告警功能
- 模板变量
- 团队协作
### 电商场景适用性
连接 PostgreSQL可视化电商产品趋势、价格分布、竞品对比等分析报表。
## Use Cases
- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]] — 数据可视化展示层
## Connections
- [[PostgreSQL]] — 读取电商数据进行可视化

30
wiki/entities/Honcho.md Normal file
View File

@@ -0,0 +1,30 @@
---
title: "Honcho"
type: entity
tags: [AI-Memory, Memory-Backend, Peer-Model, Async-Reasoning]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Basic Info
- **Type**: 产品 / AI Memory Tool
- **GitHub**: 2.4k stars
- **Category**: Camp 1 — Memory Backend
- **License**: AGPL-3.0(限制性)
- **Infrastructure**: PostgreSQL + pgvector自托管
## Summary
将人和 Agent 视为统一模型中的对等体peers。后台异步推理服务从会话中推导每个对等体的心理洞察——不仅记住你说了什么还在构建"你如何思考"的模型。
## Core Features
- 人和 Agent 统一对等体模型unified peer model
- 后台异步推理服务async reasoning service
- 从会话中推导心理洞察psychological insights
- PostgreSQL + pgvector 基础设施
## Key Insight
Camp 1 中最接近关心"实体演进"而非仅"事实存储"的方案。
## Connections
- [[ai-memory-tools-two-camps]] ← 来源 ← Honcho 是 Camp 1 中架构最独特、最接近实体演化建模的工具
- [[Memory-Backend]] ← 属于 ← Honcho 是 Memory Backend 范式的代表工具

View File

@@ -1,34 +1,35 @@
---
title: "Mem0"
type: entity
tags: [ai-agent, memory, vector-db]
last_updated: 2026-04-23
---
## Overview
GitHub 53.1k starsCamp 1Memory Backend类别的领导者。为 AI 应用和 Agent 提供智能记忆层。
## Architecture
四核心操作add、search、update、delete
三层存储粒度:
- **User level**:跨所有会话的长期用户偏好和事实
- **Session level**:当前会话内的上下文
- **Agent level**Agent 自身的元记忆
检索机制:混合搜索(语义 + 关键词)
## Strengths
- 集成最简单:Python + TypeScript SDK
- 工作流程清晰add → search → update → delete
- 与任何 LLM 兼容
## Limitations
- 记忆条目是**扁平**的,条目之间没有关系
- 提取质量完全依赖 LLM extraction prompt
- 事实存入后不进化1月的事实和4月的事实共存
- 无法真正"复合增长"——只是累积条目
## Aliases
- Mem0
- mem0
---
title: "Mem0"
type: entity
tags: [AI-Memory, Memory-Backend, Vector-DB, OpenSource]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Basic Info
- **Type**: 产品 / AI Memory Tool
- **GitHub**: 53.1k stars
- **Category**: Camp 1 — Memory Backend
- **Website**: mem0.ai
## Summary
Camp 1Memory Backend类别的领导者。四个核心操作add、search、update、delete。从对话中提取事实存储在三层级user、session、agent通过混合搜索检索。
## Core Features
- 四操作 APIadd、search、update、delete
- 三层级存储user跨会话、session单次对话、agentAgent 间共享)
- 混合搜索检索
- Python + TypeScript SDK
- 通用兼容设计
## Key Limitation
- 记忆是扁平条目,条目之间无关系
- 每次提取都需要 LLM 调用,提取质量完全依赖提取提示词
- 存储后不演进,一月的事实和四月的事实并存,无法自动处理新旧冲突
## Why It's Camp 1
Mem0 的核心问题域是"AI 应该记住什么?"属于事实召回fact recall优化——系统从对话中提取事实并注入下一轮对话。
## Connections
- [[ai-memory-tools-two-camps]] ← 来源 ← Mem0 是 Camp 1 类别领导者
- [[Memory-Backend]] ← 属于 ← Mem0 是 Memory Backend 范式的代表工具

View File

@@ -0,0 +1,40 @@
---
title: "MemPalace"
type: entity
tags: [AI-Memory, Memory-Backend, Local-First, Vector-DB, ChromaDB]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Basic Info
- **Type**: 产品 / AI Memory Tool
- **GitHub**: 46.2k stars
- **Category**: Camp 1 — Memory Backend
- **Website**: mempalace.app
## Summary
本地优先的逐字记忆工具。不同于提取事实MemPalace 逐字存储对话并组织为 Wings实体、Rooms主题、Drawers原始内容结构通过 ChromaDB 搜索。
## Core Features
- 本地优先架构(数据完全存储在本地)
- 逐字存储对话verbatim memory
- Wings/Rooms/Drawers 组织结构:
- **Wings**实体entities
- **Rooms**主题topics
- **Drawers**:原始内容
- ChromaDB 向量搜索
## Benchmark Results
LongMemEval 基准测试结果:
- 纯语义搜索(无 LLM**96.6%** 检索召回率
- 混合管道:**98.4%**
- LLM 重排:**99%+**
## Key Limitation
- 逐字存储线性增长——对话越多,占用越大
- 无压缩、无综合
- 擅长"找到三周前我说的话",不适合"给我跨五个项目的当前工作状态"
## Connections
- [[ai-memory-tools-two-camps]] ← 来源 ← MemPalace 拥有 Camp 1 中最高 LongMemEval 基准
- [[Memory-Backend]] ← 属于 ← MemPalace 是 Memory Backend 范式的代表工具

View File

@@ -1,31 +1,37 @@
---
title: "memsearch"
title: "MemSearch"
type: entity
tags: [tool, vector-search, open-source]
tags: [AI-Memory, Context-Substrate, Markdown-First, Milvus, Hybrid-Search]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Overview
memsearch 是一个基于 Milvus 向量数据库的语义搜索 CLI/库,为 Markdown 文件提供语义搜索能力。由 ZillizTech 开发。
## Basic Info
- **Type**: 产品 / AI Memory Tool
- **GitHub**: 1.2k stars
- **Category**: Camp 2 — Context Substrate
- **Infrastructure**: MilvusZilliz 团队)
- **Website**: Zilliz 生态
## Key Features
- 向量语义搜索 + BM25 全文搜索 + RRF 重排
- SHA-256 内容哈希实现增量索引
- 文件监控自动重索引
- 支持多种嵌入提供商OpenAI、Google、Voyage、Ollama、本地模式
## Summary
来自 Milvus 团队Zilliz的 Markdown 优先记忆工具。记忆是 .md 文件人类可读、可编辑、可版本控制。Milvus 作为"影子索引"从文件派生,完全可重建。
## GitHub
https://github.com/zilliztech/memsearch
## Core Philosophy
**文件是真相来源。向量搜索只是文件之上的访问层。**
## Documentation
https://zilliztech.github.io/memsearch/
## Architecture
- **第一层**语义块semantic chunks
- **第二层**完整段落full sections
- **第三层**原始转录raw transcripts
- 三层渐进披露progressive disclosure
## Related Entities
- [[OpenClaw]] — 被 memsearch 增强的记忆系统
- [[Milvus]] — 底层向量数据库
- [[memsearch]] ← built_on ← [[Milvus]]
- [[memsearch]] ← enhances ← [[OpenClaw]]
## Key Significance
这个工具来自 Zilliz——向量数据库公司。他们交付的记忆系统中他们自己的产品Milvus在文件下游。这是一个有意义的让步——承认了真相来源实际在哪里。
## Related Concepts
- [[HybridSearch]] — memsearch 使用的搜索方法
- [[RRF-Reranking]] — memsearch 使用的重排机制
- [[IncrementalIndexing]] — memsearch 的索引优化
## Hybrid Search
- 稠密向量 + BM25 + RRF 重排Reciprocal Rank Fusion
## Connections
- [[ai-memory-tools-two-camps]] ← 来源 ← MemSearch 是文件优先哲学的典型代表
- [[Context-Substrate]] ← 属于 ← MemSearch 是 Context Substrate 范式的代表工具
- [[semantic-memory-search]] ← MemSearch 是 ← [[semantic-memory-search]] 的技术实现

View File

@@ -1,108 +1,34 @@
---
title: MinIO
type: entity
tags: [docker, storage, s3, minio]
date: 2025-12-29
---
# MinIO
## Aliases
- MinIO
- MinIO Server
## Definition
MinIO 是一个开源的 S3 兼容对象存储服务器,专为高性能、海量数据场景设计。作为 [[Zipline]] 图床系统的存储后端MinIO 提供 S3 API 兼容接口,使应用无需修改即可对接。
## Core Characteristics
| 特性 | 说明 |
|------|------|
| 协议兼容 | S3 APIAmazon Simple Storage Service |
| 部署模式 | 单机 / 分布式(纠删码模式) |
| 存储介质 | 直连磁盘,无特殊要求 |
| 管理界面 | MinIO Console默认端口 9001 |
| API 端口 | 默认 9000 |
| 授权协议 | AGPLv3 |
## Architecture
```
[Application] --S3 API--> [MinIO Server] ---> [Disk/NAS Storage]
^ |
|______________________________|
MinIO Console (9001)
```
## Key Commands (mc CLI)
```bash
# 安装 MinIO Client
wget https://dl.min.io/client/mc/release/linux-amd64/mc
chmod +x mc
# 设置 alias
mc alias set local http://192.168.3.17:9000 admin StrongPasswordHere
# 创建 bucket
mc mb local/zipline-bucket
# 匿名访问策略
mc anonymous set public local/zipline-bucket # 公共读写
mc anonymous set download local/zipline-bucket # 仅下载
mc anonymous set upload local/zipline-bucket # 仅上传
mc anonymous set none local/zipline-bucket # 禁用匿名
# 查看 bucket 内容
mc ls local/zipline-bucket
```
## Use Cases in Home Server
- [[Zipline]] 图床存储后端
- S3 兼容备份目标(替代 AWS S3
- 私有云对象存储
- AI 模型权重文件存储
## Docker Deployment
```yaml
minio:
image: minio/minio:latest
command: server /data --console-address ":9001"
environment:
MINIO_ROOT_USER: admin
MINIO_ROOT_PASSWORD: Abcd_1234
ports:
- "9000:9000" # S3 API
- "9001:9001" # Console
volumes:
- /volume1/docker/zipline-stack/minio/minio_data:/data
healthcheck:
test: ["CMD", "curl", "-f", "http://localhost:9000/minio/health/live"]
interval: 30s
timeout: 20s
retries: 3
```
## Performance Characteristics (vs Zipline)
| 项目 | MinIO | Zipline |
|------|-------|---------|
| 存储性能 | 仅受 NAS 硬盘/SSD 限制 | 仅处理 metadata |
| 并发 | 高S3 原生并行) | 中等(单 Node.js 进程) |
| 数据库 | 无(内置 KV | PostgreSQL/SQLite |
| 扩展性 | 可横向扩容 | 单实例 → 前端微服务 |
| REST API | 完备 | 完备(适合 n8n |
## Connections
- [[Zipline]] ← stores files ← [[MinIO]]
- [[群晖 NAS]] ← hosts ← [[MinIO]]
- [[Docker堆栈]] ← part of ← [[MinIO]]
- [[mc命令]] ← manages ← [[MinIO]]
## Related Concepts
- [[S3-兼容对象存储]]
- [[对象存储]]
- [[图床]]
- [[数据一致性]]
---
title: "MinIO"
type: entity
tags: [object-storage, s3-compatible, open-source]
sources: [可自动化-可扩展-ai增强的电商数据采集与处理系统]
last_updated: 2025-11-11
---
## Aliases
- MinIO Object Storage
- S3 兼容存储
## Summary
开源 S3 兼容的对象存储服务,用于存储图片和视频等非结构化数据。
## Description
MinIO 是一款高性能的开源对象存储服务,兼容 Amazon S3 API。
### 核心特性
- S3 API 完全兼容
- 高性能GB/s 级吞吐量)
- 轻量级(单二进制文件)
- 分布式部署支持
- Docker 友好
### 电商场景适用性
替代云端 S3存储爬取的电商产品图片和视频降低云服务成本。
## Use Cases
- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]] — 图片和视频存储层
## Connections
- [[Scrapy]] — Scrapy ImagesPipeline 输出目标

View File

@@ -1,77 +1,39 @@
---
title: "Ollama"
type: entity
tags: []
last_updated: 2026-04-23
---
# Ollama
## Overview
Ollama 是一个开源的本地大语言模型LLM运行框架让用户可以在本地机器上部署和运行大型语言模型实现**免费离线使用 LLM 能力**,同时确保私有数据的隐私和安全性。
## Aliases
- Ollama
- ollama
## Key Facts
- **官网**: https://ollama.com
- **中文站**: https://ollama.org.cn
- **GitHub**: https://github.com/ollama/ollama
- **支持平台**: macOS, Windows, Linux, Docker
- **API 端口**: localhost:11434
## Supported Models
- DeepSeek-R1 系列1.5B ~ 671B 参数)
- Qwen 系列
- Llama 系列
- 第三方模型HuggingFace、魔塔社区
## Core Commands
| 命令 | 功能 |
|------|------|
| `ollama run <model:size>` | 下载并运行模型 |
| `ollama pull <model:size>` | 拉取模型 |
| `ollama create <name> -f <Modelfile>` | 从 Modelfile 导入本地 GGUF 模型 |
| `ollama list` | 列出所有已下载模型 |
| `ollama ps` | 列出正在运行的模型 |
| `ollama serve` | 启动 Ollama 服务 |
## Hardware Requirements
| 模型 | 建议内存 | 建议显存 | 适用场景 |
|------|---------|---------|---------|
| 1.5B | 4~8 GB | 4 GB | 轻量快速 |
| 7B | 16 GB | 14 GB | 日常使用 |
| 8B | 16 GB | 14 GB | 较高精度 |
| 14B | 32 GB | 26 GB | 复杂任务 |
| 32B | 64 GB | 48 GB | 专业级 |
| 70B+ | 128+ GB | 140+ GB | 超大规模 |
## Docker Deployment
```bash
# CPU 模式
docker run -d -p 11434:11434 -v /data/ollama:/root/.ollama --name ollama ollama/ollama
# GPU 模式
docker run --gpus=all -d -p 11434:11434 -v /data/ollama:/root/.ollama --name ollama ollama/ollama
```
## Environment Variables
| 变量 | 默认值 | 说明 |
|------|--------|------|
| OLLAMA_MODELS | ~/.ollama/models | 模型存储路径 |
| OLLAMA_HOST | 127.0.0.1 | 服务绑定地址 |
| OLLAMA_ORIGINS | * | 允许的来源域名 |
## Key Concepts
- [[Local LLM Deployment]]Ollama 是实现本地 LLM 部署的核心工具
- [[Docker LLM Deployment]]Ollama 支持 Docker 部署模式
- [[Model Quantization]]GGUF 格式量化模型可通过 `ollama create` 导入
## Related Entities
- [[DeepSeek]]Ollama 官方支持的深度求索推理模型
- [[Open WebUI]]:基于 Ollama API 的开源 Web 界面
- [[HuggingFace]]:第三方模型来源
## Sources
- [[详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决-1]]
---
title: Ollama
type: entity
tags: [ollama, 本地大模型, 开源]
last_updated: 2026-04-28
---
## Aliases
- ollama
- Ollama
## Definition
Ollama 是一款本地大模型运行时工具,支持通过单一命令安装、管理和运行开源 LLM如 Qwen2.5-Coder、Llama、DeepSeek 等),提供 REST API 和多语言 SDK。
## Key Facts
- **官网**https://ollama.com
- **安装命令**`curl -fsSL https://ollama.com/install.sh | sh`
- **API 默认端口**11434
- **默认监听**127.0.0.1(仅本地)
- **远程访问配置**:设置 `OLLAMA_HOST=0.0.0.0` 环境变量
- **GPU 支持**:安装 NVIDIA CUDA 后自动使用 GPU 加速,无需额外配置
- **systemd**:安装后自动创建 systemd 服务,开机自启
## Capabilities
- CLI 交互模式:`ollama run <model>`
- 模型管理:`ollama list``ollama rm <model>``ollama pull <model>`
- REST API`http://localhost:11434/api/chat`
- Python SDK`pip install ollama`
- NodeJS SDK`npm install ollama`
## Used By
- [[Open WebUI]] — ChatGPT 风格 Web 界面
- [[n8n]] — AI 工作流自动化平台
- [[LangChain]] — Agent 开发框架
- [[OpenClaw]] — AI Coding Agent
- [[Qwen2.5-Coder]] — 主要推荐运行模型之一
## Sources
- [[在-ubuntu-安装-ollama-并运行-qwen2-5coder-7b]]

View File

@@ -1,46 +1,35 @@
---
title: "Playwright"
type: entity
tags: ["browser-automation", "web-scraping", "playwright", "javascript"]
sources: ["marketing-carousel-growth-engine"]
last_updated: 2026-04-26
tags: [browser-automation, open-source, microsoft]
sources: [可自动化-可扩展-ai增强的电商数据采集与处理系统]
last_updated: 2025-11-11
---
## Definition
微软出品的浏览器自动化框架,支持 Chromium/Firefox/WebKit 多浏览器引擎。在 [[marketing-carousel-growth-engine]] 中用于抓取任意网站 URL提取品牌信息和内容。
## Key Details
- **Engine**: Playwright with Chromium完整 JavaScript 渲染页面抓取)
- **Usage**: 导航目标 URL 及内部页面pricing、features、about、testimonials
- **Script**: `analyze-web.js` 执行完整业务研究,输出 `analysis.json`
- **Requires**: `playwright install chromium`
## Output (analysis.json)
- **品牌提取**: 名称、Logo、配色、字体、Favicon
- **内容分析**: 标题、标语、功能、定价、客户评价、数据、CTA
- **内部页面导航**: pricing / features / about / testimonials
- **竞品检测**: 从网站内容识别 20+ 已知 SaaS 竞品
- **业务分类**: 业务类型和细分市场识别
- **钩子生成**: 针对细分市场的痛点钩子
- **视觉上下文**: 用于幻灯片生成的视觉参考定义
## Usage in Carousel Growth Engine Pipeline
```
Phase 2: Research & Analyze
1. analyze-web.js → Playwright 完整分析目标 URL
2. 品牌提取(颜色/字体/Logo/Favicon
3. 内容挖掘(功能/评价/定价/CTA
4. 细分检测(业务类型分类)
5. 竞品映射(竞品识别)
Phase 3: Generate & Verify
Gemini 根据 analysis.json 提示词生成幻灯片
```
## Aliases
- Playwright
- playwright
- Microsoft Playwright
- playwright-python
- playwright-node
## Summary
微软开源的浏览器自动化工具,支持 Chromium/Firefox/WebKit提供可靠动态页面渲染能力。
## Description
Playwright 是微软开发的浏览器自动化框架支持多种编程语言Python、Node.js
### 核心特性
- 跨浏览器支持Chromium、Firefox、WebKit
- 可靠等待机制,避免时序问题
- 自动截图、PDF 生成
- 无头模式和有头模式
- 模拟移动端视图
### 电商场景适用性
解决 JavaScript 渲染页面的抓取问题(如电商网站的无限滚动、懒加载、登录墙)。
## Use Cases
- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]] — 动态页面渲染解决方案
## Connections
- [[Scrapy]] — scrapy-playwright 插件集成

View File

@@ -0,0 +1,43 @@
---
title: Qwen2.5-Coder
type: entity
tags: [qwen, qwen-coder, 通义千问, 代码大模型, 开源]
last_updated: 2026-04-28
---
## Aliases
- Qwen2.5-Coder
- qwen2.5-coder
- 通义千问代码模型
- Qwen Coder
## Definition
Qwen2.5-Coder 是阿里云通义千问团队开发的代码专用大模型,参数规模覆盖 1.5B/3B/7B/14B/32B其中 7B 版本约 4.5GB,擅长 Tool usage、Shell/Python/SQL 理解和 Repo 级代码理解。
## Key Facts
- **开发方**阿里云通义千问Qwen团队
- **适用场景**DevOps automation、SQL Agent、Kubernetes troubleshooting、n8n workflow AI
- **推荐配置**CPU 8+ cores、RAM 16GB、NVIDIA GPU可选
- **Ollama 模型名**`qwen2.5-coder:7b`
- **下载大小**:约 4.5GB
- **对比优势**:相比普通 `qwen2.5:7b`Tool usage 能力更强Shell/Python/SQL 理解更深Repo 级代码理解更优
## Why Qwen2.5-Coder vs Qwen2.5
| 能力 | qwen2.5-coder:7b | qwen2.5:7b |
|------|-------------------|------------|
| Tool usage | ✅ 强 | ⚠️ 一般 |
| Shell/Python/SQL 理解 | ✅ 强 | ⚠️ 一般 |
| Repo 级代码理解 | ✅ 强 | ⚠️ 一般 |
| 通用对话 | ⚠️ 可用 | ✅ 强 |
## Recommended Pairings
| 工具 | 用途 |
|------|------|
| [[Open WebUI]] | ChatGPT 风格 Web UI |
| [[n8n]] | AI 自动化工作流 |
| [[LangChain]] | Agent 框架 |
| [[OpenClaw]] | AI Coding Agent |
| [[Ollama]] | 本地运行时 |
## Sources
- [[在-ubuntu-安装-ollama-并运行-qwen2-5coder-7b]]

35
wiki/entities/Scrapy.md Normal file
View File

@@ -0,0 +1,35 @@
---
title: "Scrapy"
type: entity
tags: [python, crawler, open-source]
sources: [可自动化-可扩展-ai增强的电商数据采集与处理系统]
last_updated: 2025-11-11
---
## Aliases
- Scrapy Framework
## Summary
Python 编写的开源爬虫框架,适合结构化数据抓取、分页调度、媒体下载和分布式部署。
## Description
Scrapy 是一个基于 Python 的开源网页爬虫框架,提供完整的数据爬取流程支持:请求调度、内容解析、数据清洗、管道存储。
### 核心特性
- 异步架构,性能高效
- 内置选择器CSS/XPath
- 插件生态丰富scrapy-playwright、scrapy-redis
- 支持分布式部署Scrapyd、Scrapy Cluster
- 内置 `ImagesPipeline` 媒体下载
### 电商场景适用性
适合批量抓取电商产品信息(标题、价格、描述、图片 URL输出 JSON/CSV 格式供后续处理。
## Use Cases
- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]] — 数据采集层核心工具
## Connections
- [[Playwright]] — 动态页面渲染依赖
- [[PostgreSQL]] — 数据存储目标
- [[n8n]] — 自动化编排消费 Scrapy 输出

View File

@@ -0,0 +1,34 @@
---
title: "Supermemory"
type: entity
tags: [AI-Memory, Memory-Backend, Temporal-Awareness, OpenSource]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Basic Info
- **Type**: 产品 / AI Memory Tool
- **GitHub**: 21.8k stars
- **Category**: Camp 1 — Memory Backend
- **Website**: supermemory.ai
## Summary
明确定位"memory is not RAG",差异化在于时间感知——说"我刚搬到旧金山"会自动覆盖旧城市信息,过期事实自动遗忘。用户画像结合稳定事实和近期活动,检索约 50ms。
## Core Features
- 时间感知过期事实自动遗忘temporal awareness
- 用户画像:稳定事实 + 近期活动结合
- ~50ms 检索延迟
- 连接器Google Drive、Gmail、Notion、OneDrive、GitHub
- 多模态支持PDF、图片、视频、代码
## Benchmark Claims
- MemoryBench 基准框架(自创)
- 声称在 LongMemEval、LoCoMo、ConvoMem 排名第一
## Key Insight
大多数 Camp 1 工具将事实视为永久存储。Supermemory 将其视为演进中的数据——这是 Camp 1 中最接近"状态管理"思维的方案。
## Connections
- [[ai-memory-tools-two-camps]] ← 来源 ← Supermemory 是 Camp 1 中时间感知最强、时间演进处理最完善的工具
- [[Memory-Backend]] ← 属于 ← Supermemory 仍在 Memory Backend 范式内,但引入了状态演进思想

39
wiki/entities/Thoth.md Normal file
View File

@@ -0,0 +1,39 @@
---
title: "Thoth"
type: entity
tags: [AI-Memory, Context-Substrate, Knowledge-Graph, Dream-Cycle, FAISS]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Basic Info
- **Type**: 产品 / AI Memory Tool
- **GitHub**: 145 stars
- **Category**: Camp 2 — Context Substrate
- **Infrastructure**: FAISS
## Summary
小项目但发现了整个领域中架构最深邃的方案之一。Thoth 构建了一个包含 10 种实体类型、由 67 种有向类型化关系连接的个人知识图谱。Dream Cycle 是夜间四阶段过程——重复合并、描述富化、关系推断、置信度衰减。
## Core Architecture
- 10 种实体类型
- 67 种有向类型化关系typed directional relations
- FAISS 向量搜索 + 每次 LLM 调用前一跳图扩展
- 三层反污染机制防止跨实体事实串扰
## Dream Cycle四阶段夜间整合
1. **重复合并**:相似度 ≥ 0.93 的重复项合并
2. **描述富化**:从对话上下文中丰富描述
3. **关系推断**:推断共现实体之间的关系
4. **置信度衰减**:超过 90 天的关系置信度衰减
## Why Only 145 Stars
因为需要用户认真对待 Camp 2 论点,肯为自己的上下文设置知识图谱——大多数人不愿意。大多数人想要一键安装的内存后端。
## Worth Watching
Thoth 的架构是整个 Camp 2 领域最接近自动化知识图谱构建和维护的方案,其反污染机制和置信度衰减是独特的创新。
## Connections
- [[ai-memory-tools-two-camps]] ← 来源 ← Thoth 是架构最深邃的 Camp 2 工具
- [[Context-Substrate]] ← 属于 ← Thoth 是 Context Substrate 范式的代表工具
- [[Dream-Cycle]] ← 实现 ← Thoth 实现了 Dream Cycle 四阶段夜间整合

View File

@@ -0,0 +1,39 @@
---
title: "TrustGraph"
type: entity
tags: [AI-Memory, Context-Substrate, Context-Cores, Version-Control, Knowledge-Graph]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Basic Info
- **Type**: 产品 / AI Memory Tool
- **GitHub**: 2.0k stars
- **Category**: Camp 2 — Context Substrate
- **Infrastructure**: Cassandra + Qdrant
## Summary
引入"Context Cores"概念——便携、带版本的上下文容器,包含领域 schema、知识图谱、向量嵌入、证据来源和检索策略。将上下文视为代码版本化、测试、推动、回滚。
## Core Innovation: Context Cores
Context Cores 是 TrustGraph 的核心概念——将上下文作为第一等公民的制品first-class artifact
- 包含:领域 schema、知识图谱、向量嵌入、证据来源、检索策略
- 可版本化versioning
- 可测试testable
- 可推动promotable
- 可回滚rollable back
## Conceptual Significance
每个 Camp 1 工具将记忆视为对话的副作用。TrustGraph 将上下文视为第一等公民的制品有身份identity、版本version和生命周期lifecycle
可操作价值:
- 将 Context Core 交给新 Agent → 继承完整运营上下文
- 分叉一个 Context Core 做实验 → 合并回主分支
## Implementation Note
实现较重Cassandra + Qdrant但概念模型是正确的方向。
## Connections
- [[ai-memory-tools-two-camps]] ← 来源 ← TrustGraph 引入了 Context Cores 概念
- [[Context-Substrate]] ← 属于 ← TrustGraph 是 Context Substrate 范式的代表工具
- [[Context-Cores]] ← 引入 ← TrustGraph

38
wiki/entities/Zep.md Normal file
View File

@@ -0,0 +1,38 @@
---
title: "Zep"
type: entity
tags: [AI-Memory, Context-Substrate, Temporal-Knowledge-Graph, Graphiti, Enterprise]
sources: [ai-memory-tools-two-camps]
last_updated: 2026-04-15
---
## Basic Info
- **Type**: 产品 / AI Memory Tool
- **GitHub**: 4.4k stars
- **Category**: Camp 2 — Context Substrate从"Memory"重新品牌)
- **Framework**: GraphitiTKG 时间知识图谱)
- **Compliance**: SOC2 Type 2, HIPAA
- **Website**: getzep.com
## Summary
Zep 从"Memory"全面重新品牌定位为"Context Engineering"——这是整个领域最强的市场信号。融资公司看到领域走向,决定"Memory"是错误的词。底层使用时间知识图谱Graphiti事实包含 valid_at 和 invalid_at 时间戳,自动提取关系并返回预格式化上下文块。
## Core Features
- 时间知识图谱Temporal Knowledge Graph via Graphiti
- valid_at / invalid_at 时间戳(事实的时间有效性)
- 自动关系提取
- 预格式化上下文块(优化 LLM 消费)
- <200ms 检索延迟
- SOC2 Type 2 + HIPAA 合规(企业级)
## The Rebrand Signal
Zep 从"memory"重塑品牌为"context engineering"是整个 AI 记忆工具领域最强的市场信号——一家有融资的公司选择放弃"Memory"这个词,表明他们看到了领域正在向 Context Substrate 方向演进。
## Position in the Landscape
Zep 在两个阵营之间架起了桥梁——仍然提取和检索,但在架构上最接近 Camp 2。他们的重新品牌化行为比任何技术实现都更能说明问题。
## Connections
- [[ai-memory-tools-two-camps]] ← 来源 ← Zep 的重新品牌化是领域最强市场信号
- [[Context-Substrate]] ← 属于 ← Zep 被重新品牌定位为 Context Engineering
- [[Context-Engineering]] ← Zep 重新品牌化为 ← Zep
- [[ai-memory-tools-two-camps]] ← Zep ← 是 Camp 1/Camp 2 边界的跨越者

View File

@@ -1,31 +1,26 @@
---
title: "kepano"
type: entity
tags: [obsidian, developer, skills]
last_updated: 2026-04-21
---
## Basic Info
- **Role**: Obsidian CEO / Founder
- **GitHub**: `kepano/obsidian-skills`
## Aliases
- kepano
## Key Contributions
发布了 Obsidian 官方 Skills 仓库 (`kepano/obsidian-skills`),包含以下 Skills
| Skill | 功能 | 推荐度 |
|-------|------|--------|
| [[Defuddle]] | 网页内容清洗,将杂乱 HTML 转为纯净 Markdown支持 YouTube 字幕获取 | ✅ |
| [[Obsidian-CLI]] | AI Agent 调用 Obsidian 官方 CLI增删改查笔记 | ✅ |
| [[Obsidian-Bases]] | 通过 .base 文件创建 Obsidian 动态数据库视图 | ✅ |
| [[Obsidian-Markdown]] | 编写符合 Obsidian 规范的增强版 Markdown 文档 | ⚠️ |
| [[Json-Canvas]] | 创建和编辑 Obsidian .canvas 白板文件(底层 JSON 语法) | ❌ |
## Connections
- [[obsidian-必装-skills]] — 主要贡献者
- [[Obsidian]] — Obsidian 笔记软件创始人/CEO
- [[Defuddle]] — kepano 发布的 Skill
- [[Obsidian-CLI]] — kepano 发布的 Skill
- [[Obsidian-Bases]] — kepano 发布的 Skill
---
title: "kepano"
type: entity
tags: [obsidian, open-source]
last_updated: 2026-04-28
---
## kepanoObsidian CEO
### 简介
kepano 是 Obsidian 笔记软件背后公司 Obsidian Privacy, LLC 的创始人和 CEO同时也是 GitHub 仓库 `kepano/obsidian-skills` 的维护者。
### 发布的 Skills
kepano 维护的 obsidian-skills 仓库包含以下核心工具:
- [[defuddle]]:网页内容清洗工具,通过剔除广告和导航栏来保留纯净 Markdown
- [[obsidian-cli]]:让 AI Agent 直接调用 Obsidian 官方命令行工具
- [[obsidian-bases]]:通过 .base 文件创建类似 Notion 数据库的动态视图
- [[obsidian-markdown]]:符合 Obsidian 官方规范的增强版 Markdown 编写工具(⚠️ 不推荐)
### 关键立场
- 明确反对 OpenClaw 官方的 obsidian-skill直接文件系统 I/O认为 Token 消耗大且不稳定
- 推荐使用官方 CLI 接口 obsidian-cli 作为 AI 与 Obsidian 通信的标准方式
### Aliases
- Obsidian CEO

View File

@@ -24,6 +24,7 @@ last_updated: 2026-05-01
## Sources
- [[2025-年-11-个神级-ai-开源平替-github-杀疯了]]
- [[n8n-workflow-orchestration]]
- [[可自动化-可扩展-ai增强的电商数据采集与处理系统]]
- [[n8n-docker-install-update]]
- [[n8n-full-tutorial-building-ai-agents-in-2025-for-beginners]]
- [[n8n-claude-通过自然语言自动化工作流]]