wiki-ingest batch 2026-04-16: Ollama/Qwen2.5-Coder部署 + NFS永久挂载 + Apache Superset Docker
This commit is contained in:
@@ -35,6 +35,14 @@ df -h | grep nas_backup # 验证挂载成功
|
||||
- 重启后仍然失效:systemctl enable remote-fs.target
|
||||
- nfs-common 服务启动慢于 mount -a:_netdev 参数解决
|
||||
|
||||
## 完整部署指南
|
||||
[[如何在UbuntuServer上通过NFS挂载Synology NAS上的共享文件夹]] 包含:
|
||||
- Synology DSM NFS 权限配置步骤截图
|
||||
- NFS 永久挂载参数详解(_netdev 为关键防开机卡死参数)
|
||||
- rsync 备份脚本挂载检查逻辑
|
||||
- 常见问题:remote-fs.target 启用
|
||||
|
||||
## Connections
|
||||
- [[Ubuntu服务器通过rsync实现日常增量备份]] — 应用场景
|
||||
- [[rsync增量备份]] — 备份目标端挂载
|
||||
- [[Synology NAS]] ← 提供 ← NFS 存储服务(192.168.3.17:/volume2/backup)
|
||||
|
||||
45
wiki/concepts/本地AI推理.md
Normal file
45
wiki/concepts/本地AI推理.md
Normal file
@@ -0,0 +1,45 @@
|
||||
---
|
||||
title: 本地AI推理
|
||||
type: concept
|
||||
tags: [AI, 本地部署, 推理]
|
||||
sources: []
|
||||
last_updated: 2026-04-16
|
||||
---
|
||||
|
||||
## 定义
|
||||
在自有硬件(本地服务器或 PC)上运行 LLM 推理,而非调用云服务 API。
|
||||
|
||||
## 核心优势
|
||||
- **数据隐私**:敏感数据不出本地网络
|
||||
- **成本可控**:无 token 计费,硬件一次性投入
|
||||
- **延迟可控**:内网延迟极低
|
||||
- **离线可用**:不依赖外部网络
|
||||
|
||||
## 主流方案
|
||||
|
||||
| 方案 | 定位 | 最低配置 | GPU需求 |
|
||||
|------|------|---------|---------|
|
||||
| [[Ollama]] | 快速原型/轻量 | 4核CPU+8GB RAM | 可选 |
|
||||
| [[vLLM]] | 高并发企业级 | 8核CPU+32GB RAM | 必须 |
|
||||
| llama.cpp | 极致轻量 | 2核CPU+4GB RAM | 可选 |
|
||||
|
||||
## Ollama 部署路径
|
||||
1. `curl -fsSL https://ollama.com/install.sh | sh`
|
||||
2. `ollama pull qwen2.5-coder:7b`(≈4.5GB)
|
||||
3. `ollama run qwen2.5-coder:7b`
|
||||
|
||||
## 远程 API 暴露
|
||||
默认只监听 127.0.0.1,通过环境变量开放:
|
||||
```
|
||||
Environment="OLLAMA_HOST=0.0.0.0" # /etc/systemd/system/ollama.service
|
||||
```
|
||||
可被 [[n8n]]/[[OpenClaw]]/[[OpenWebUI]] 等工具远程调用。
|
||||
|
||||
## GPU 加速
|
||||
- NVIDIA GPU + CUDA 环境下 Ollama 自动调度 GPU
|
||||
- 无需额外配置,`nvidia-smi` 验证即可
|
||||
|
||||
## Connections
|
||||
- [[本地AI推理]] ← 部署平台 ← [[Ollama]]
|
||||
- [[本地AI推理]] ← 推荐模型 ← [[Qwen]](qwen2.5-coder:7b)
|
||||
- [[n8n]] ← 可调用 ← [[本地AI推理]](通过 HTTP Request Node)
|
||||
Reference in New Issue
Block a user