Files
nexus/wiki/sources/详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决-1.md
2026-04-23 05:51:04 +08:00

5.2 KiB
Raw Blame History

title, type, tags, date
title type tags date
详细离线部署大模型ollama+deepseek+open-webui安装使用方法及常见问题解决 1 source
2026-04-23

Source File

Summary用中文描述

  • 核心主题如何在本地机器上离线部署和运行大语言模型LLM使用 Ollama + DeepSeek + Open WebUI 实现私有化 AI 服务
  • 问题域:国内网络环境下 LLM 部署面临的下载慢、无 API Key、数据隐私等挑战
  • 方法/机制:
    • Ollama跨平台macOS/Windows/Linux/Docker本地 LLM 运行框架
    • DeepSeek-R1 系列蒸馏模型1.5B~671B 参数多个版本
    • Open WebUI基于浏览器的开源 Web 界面,集成 Ollama API
    • 离线方案:通过第三方(魔塔社区/HuggingFace Mirror/夸克网盘)下载模型文件后用 ollama create 导入
    • 局域网访问:通过环境变量 OLLAMA_HOST=0.0.0.0 配置
    • API 安全:通过 nginx 反向代理 + Bearer Token 保护云服务器部署
  • 结论/价值:提供完整的国内环境本地 LLM 部署实操指南,覆盖安装、下载、调优、安全配置的完整闭环

Key Claims用中文描述

  • Ollama 提供简洁的跨平台 LLM 部署方案4GB RAM 跑 1.5B 模型32GB RAM 跑 33B 模型
  • DeepSeek-R1:32b 及以下模型可在 Apple M2 Max Mac Studio 上流畅运行
  • 模型下载速度开始快后变慢可通过间隔重启下载进程解决
  • Docker 部署 Ollama 可实现 GPU 加速(--gpus=all
  • 云服务器部署必须配置 API KEY 保护nginx + Bearer Token防止被恶意调用
  • Open WebUI 可通过 docker-compose 一键部署,集成 DeepSeek-R1:8b 和 bge-m3 嵌入模型

Key Quotes

"你应该至少有 4 GB 的 RAM 来运行 1.5B 模型,至少有 8 GB 的 RAM 来运行 7B 模型16 GB 的 RAM 来运行 13B 模型,以及 32 GB 的 RAM 来运行 33B 模型。" — Ollama 硬件要求参考 "假若需要本地私有化部署具有实用性的模型,应至少有独立显卡并有 4G 以上显存。纯 CPU 模式虽然也可以运行,但生成速度很慢,仅适用于本地开发调试体验一下。" — 实用部署建议 "如果你是在云服务器等拥有公网IP的环境上部署请谨慎做此设置OLLAMA_HOST=0.0.0.0),否则可能导致 API 服务被恶意调用。" — 云服务器安全警告

Key Concepts

  • Local LLM Deployment:在本地机器上离线运行大语言模型,确保数据隐私,无需 API Key 费用
  • Ollama:开源本地 LLM 运行框架,提供简单命令行和 API 接口
  • Open WebUI:开源 Web 界面工具,为 Ollama 等 LLM 提供图形化交互体验
  • RAG检索增强生成Open WebUI 使用 bge-m3 嵌入模型构建本地知识库
  • Docker LLM Deployment:通过 Docker 容器化部署 Ollama 和 Open WebUI
  • Model QuantizationGGUF 格式量化模型,通过 ollama create 导入本地文件

Key Entities

  • Ollama:开源本地 LLM 框架,支持 macOS/Windows/Linux/Docker官方站 ollama.com中文站 ollama.org.cn
  • DeepSeek:深度求索 AI 公司,发布 DeepSeek-R1 系列开源推理模型1.5B~671Bollama 官方模型库支持
  • Open WebUI:开源大模型 Web 界面项目ghcr.io/open-webui/open-webui通过 Ollama API 集成多种 LLM支持 RAG 知识库和联网搜索
  • HuggingFace Mirrorhf-mirror.comHuggingFace 国内镜像站,解决模型下载速度问题
  • 魔塔社区modelscope.cn阿里达摩院模型库ollama 支持直接从魔塔下载模型
  • 夸克网盘第三方离线模型下载渠道deepseek-r1 模型夸克链接共享

Connections

Contradictions

  • 无已知冲突页面

DeepSeek-R1 模型规格参考

参数版本 模型大小 建议内存 建议显存 特点
deepseek-r1:1.5b 1.1GB 4~8G 4GB 轻量级,速度快
deepseek-r1:7b 4.7GB 16G 14GB 性能较好,硬件适中
deepseek-r1:8b 4.9GB 16G 14GB 略强于 7b精度更高
deepseek-r1:14b 9GB 32G 26GB 高性能,复杂任务
deepseek-r1:32b 20GB 64G 48GB 专业级,高精度
deepseek-r1:70b 43GB 128G 140GB 顶级模型,大规模计算
deepseek-r1:671b 404GB 512G 1342GB 超大规模,推理速度快

Ollama 常用命令

命令 功能
ollama --version 验证安装
ollama serve 启动服务
ollama run <model:size> 下载并运行模型
ollama pull <model:size> 拉取模型
ollama create <name> -f <Modelfile> 从 Modelfile 导入本地模型
ollama list 列出所有模型
ollama show <model> 显示模型详情
ollama ps 列出运行中的模型
ollama rm <model> 删除模型