nexus/wiki/sources/详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决-1.md at 8c909c9c0890da1f775aba2c27583e50916074d7

ishenwei/nexus

Fork 0

Files

weishen c8599198a0 手动更新

2026-04-23 05:51:04 +08:00

5.2 KiB

Raw Blame History

title, type, tags, date

title

type

Source File

AI/详细！离线部署大模型：ollama+deepseek+open-webui安装使用方法及常见问题解决 1.md

Summary（用中文描述）

核心主题：如何在本地机器上离线部署和运行大语言模型（LLM），使用 Ollama + DeepSeek + Open WebUI 实现私有化 AI 服务
问题域：国内网络环境下 LLM 部署面临的下载慢、无 API Key、数据隐私等挑战
方法/机制：
- Ollama：跨平台（macOS/Windows/Linux/Docker）本地 LLM 运行框架
- DeepSeek-R1 系列蒸馏模型：1.5B~671B 参数多个版本
- Open WebUI：基于浏览器的开源 Web 界面，集成 Ollama API
- 离线方案：通过第三方（魔塔社区/HuggingFace Mirror/夸克网盘）下载模型文件后用 ollama create 导入
- 局域网访问：通过环境变量 OLLAMA_HOST=0.0.0.0 配置
- API 安全：通过 nginx 反向代理 + Bearer Token 保护云服务器部署
结论/价值：提供完整的国内环境本地 LLM 部署实操指南，覆盖安装、下载、调优、安全配置的完整闭环

Key Claims（用中文描述）

Ollama 提供简洁的跨平台 LLM 部署方案，4GB RAM 跑 1.5B 模型，32GB RAM 跑 33B 模型
DeepSeek-R1:32b 及以下模型可在 Apple M2 Max Mac Studio 上流畅运行
模型下载速度开始快后变慢可通过间隔重启下载进程解决
Docker 部署 Ollama 可实现 GPU 加速（--gpus=all）
云服务器部署必须配置 API KEY 保护（nginx + Bearer Token）防止被恶意调用
Open WebUI 可通过 docker-compose 一键部署，集成 DeepSeek-R1:8b 和 bge-m3 嵌入模型

Key Quotes

"你应该至少有 4 GB 的 RAM 来运行 1.5B 模型，至少有 8 GB 的 RAM 来运行 7B 模型，16 GB 的 RAM 来运行 13B 模型，以及 32 GB 的 RAM 来运行 33B 模型。" — Ollama 硬件要求参考 "假若需要本地私有化部署具有实用性的模型，应至少有独立显卡并有 4G 以上显存。纯 CPU 模式虽然也可以运行，但生成速度很慢，仅适用于本地开发调试体验一下。" — 实用部署建议 "如果你是在云服务器等拥有公网IP的环境上部署，请谨慎做此设置（OLLAMA_HOST=0.0.0.0），否则可能导致 API 服务被恶意调用。" — 云服务器安全警告

Key Concepts

Local LLM Deployment：在本地机器上离线运行大语言模型，确保数据隐私，无需 API Key 费用
Ollama：开源本地 LLM 运行框架，提供简单命令行和 API 接口
Open WebUI：开源 Web 界面工具，为 Ollama 等 LLM 提供图形化交互体验
RAG：检索增强生成，Open WebUI 使用 bge-m3 嵌入模型构建本地知识库
Docker LLM Deployment：通过 Docker 容器化部署 Ollama 和 Open WebUI
Model Quantization：GGUF 格式量化模型，通过 ollama create 导入本地文件

Key Entities

Ollama：开源本地 LLM 框架，支持 macOS/Windows/Linux/Docker，官方站 ollama.com，中文站 ollama.org.cn
DeepSeek：深度求索 AI 公司，发布 DeepSeek-R1 系列开源推理模型（1.5B~671B），ollama 官方模型库支持
Open WebUI：开源大模型 Web 界面项目（ghcr.io/open-webui/open-webui），通过 Ollama API 集成多种 LLM，支持 RAG 知识库和联网搜索
HuggingFace Mirror（hf-mirror.com）：HuggingFace 国内镜像站，解决模型下载速度问题
魔塔社区（modelscope.cn）：阿里达摩院模型库，ollama 支持直接从魔塔下载模型
夸克网盘：第三方离线模型下载渠道，deepseek-r1 模型夸克链接共享

Connections

Ollama ← runs ← DeepSeek
Ollama ← hosts ← Open WebUI
Open WebUI ← uses ← RAG（bge-m3 嵌入模型）
Local LLM Deployment ← solved_by ← Ollama + DeepSeek + Open WebUI
Docker LLM Deployment ← extends ← Docker（Ollama 的 Docker 部署模式）

Contradictions

无已知冲突页面

DeepSeek-R1 模型规格参考

参数版本	模型大小	建议内存	建议显存	特点
deepseek-r1:1.5b	1.1GB	4~8G	4GB	轻量级，速度快
deepseek-r1:7b	4.7GB	16G	14GB	性能较好，硬件适中
deepseek-r1:8b	4.9GB	16G	14GB	略强于 7b，精度更高
deepseek-r1:14b	9GB	32G	26GB	高性能，复杂任务
deepseek-r1:32b	20GB	64G	48GB	专业级，高精度
deepseek-r1:70b	43GB	128G	140GB	顶级模型，大规模计算
deepseek-r1:671b	404GB	512G	1342GB	超大规模，推理速度快

Ollama 常用命令

命令	功能
`ollama --version`	验证安装
`ollama serve`	启动服务
`ollama run <model:size>`	下载并运行模型
`ollama pull <model:size>`	拉取模型
`ollama create <name> -f <Modelfile>`	从 Modelfile 导入本地模型
`ollama list`	列出所有模型
`ollama show <model>`	显示模型详情
`ollama ps`	列出运行中的模型
`ollama rm <model>`	删除模型

5.2 KiB Raw Blame History Unescape Escape

Source File

Summary（用中文描述）

Key Claims（用中文描述）

Key Quotes

Key Concepts

Key Entities

Connections

Contradictions

DeepSeek-R1 模型规格参考

Ollama 常用命令

5.2 KiB

Raw Blame History