wiki-ingest batch 2026-04-16: Ollama/Qwen2.5-Coder部署 + NFS永久挂载 + Apache Superset Docker

This commit is contained in:
2026-04-16 01:06:49 +08:00
parent 5ae9550d8c
commit deaab02baf
11 changed files with 296 additions and 5 deletions

View File

@@ -35,6 +35,14 @@ df -h | grep nas_backup # 验证挂载成功
- 重启后仍然失效systemctl enable remote-fs.target
- nfs-common 服务启动慢于 mount -a_netdev 参数解决
## 完整部署指南
[[如何在UbuntuServer上通过NFS挂载Synology NAS上的共享文件夹]] 包含:
- Synology DSM NFS 权限配置步骤截图
- NFS 永久挂载参数详解_netdev 为关键防开机卡死参数)
- rsync 备份脚本挂载检查逻辑
- 常见问题remote-fs.target 启用
## Connections
- [[Ubuntu服务器通过rsync实现日常增量备份]] — 应用场景
- [[rsync增量备份]] — 备份目标端挂载
- [[Synology NAS]] ← 提供 ← NFS 存储服务192.168.3.17:/volume2/backup

View File

@@ -0,0 +1,45 @@
---
title: 本地AI推理
type: concept
tags: [AI, 本地部署, 推理]
sources: []
last_updated: 2026-04-16
---
## 定义
在自有硬件(本地服务器或 PC上运行 LLM 推理,而非调用云服务 API。
## 核心优势
- **数据隐私**:敏感数据不出本地网络
- **成本可控**:无 token 计费,硬件一次性投入
- **延迟可控**:内网延迟极低
- **离线可用**:不依赖外部网络
## 主流方案
| 方案 | 定位 | 最低配置 | GPU需求 |
|------|------|---------|---------|
| [[Ollama]] | 快速原型/轻量 | 4核CPU+8GB RAM | 可选 |
| [[vLLM]] | 高并发企业级 | 8核CPU+32GB RAM | 必须 |
| llama.cpp | 极致轻量 | 2核CPU+4GB RAM | 可选 |
## Ollama 部署路径
1. `curl -fsSL https://ollama.com/install.sh | sh`
2. `ollama pull qwen2.5-coder:7b`≈4.5GB
3. `ollama run qwen2.5-coder:7b`
## 远程 API 暴露
默认只监听 127.0.0.1,通过环境变量开放:
```
Environment="OLLAMA_HOST=0.0.0.0" # /etc/systemd/system/ollama.service
```
可被 [[n8n]]/[[OpenClaw]]/[[OpenWebUI]] 等工具远程调用。
## GPU 加速
- NVIDIA GPU + CUDA 环境下 Ollama 自动调度 GPU
- 无需额外配置,`nvidia-smi` 验证即可
## Connections
- [[本地AI推理]] ← 部署平台 ← [[Ollama]]
- [[本地AI推理]] ← 推荐模型 ← [[Qwen]]qwen2.5-coder:7b
- [[n8n]] ← 可调用 ← [[本地AI推理]](通过 HTTP Request Node