58 lines
3.6 KiB
Markdown
58 lines
3.6 KiB
Markdown
---
|
||
title: "详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决"
|
||
type: source
|
||
tags: [AI, LLM, 本地部署, Ollama, DeepSeek, Open WebUI, Docker, RAG]
|
||
date: 2026-05-07
|
||
---
|
||
|
||
## Source File
|
||
- [[raw/AI/详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决 1.md]]
|
||
|
||
## Summary(用中文描述)
|
||
- 核心主题:使用 ollama + DeepSeek + Open WebUI 在本地离线部署大语言模型,提供图形化界面与 RAG 本地知识库能力
|
||
- 问题域:如何在没有网络或注重隐私的环境下本地运行大模型、如何加速模型下载、如何集成可视化界面
|
||
- 方法/机制:ollama 跨平台安装(原生/Docker)、DeepSeek-R1 系列多规格模型下载、本地模型导入、API 配置、Open WebUI Docker 部署、RAG 嵌入模型配置
|
||
- 结论/价值:完整覆盖从零安装到生产使用的全链路操作手册,含详尽硬件要求、模型规格对照表、常见问题解决方案
|
||
|
||
## Key Claims(用中文描述)
|
||
- ollama 在 macOS(Apple M2 Max)上可流畅运行 DeepSeek-R1:32b 及以下模型
|
||
- DeepSeek-R1:32b 需要 16核 CPU + 64GB 内存 + 48GB 显存的硬件配置
|
||
- 模型下载速度变慢时,间隔性中断并重试可有效提速
|
||
- 通过魔塔社区(modelscope.cn)和 HF 国内镜像(hf-mirror.com)可绕过官方下载限速
|
||
- Open WebUI 可通过 docker-compose 一键部署,集成 ollama API 和 RAG 本地知识库
|
||
- 公网部署 ollama API 必须加 nginx API KEY 保护,否则存在安全风险
|
||
|
||
## Key Quotes
|
||
> "你应该至少有 4 GB 的 RAM 来运行 1.5B 模型,至少有 8 GB 的 RAM 来运行 7B 模型,16 GB 的 RAM 来运行 13B 模型,以及 32 GB 的 RAM 来运行 33B 模型。" — ollama 官方硬件建议
|
||
|
||
> "纯 CPU 模式虽然也可以运行,但生成速度很慢,仅适用于本地开发调试体验一下。" — 作者评价
|
||
|
||
> "如果你是在云服务器等拥有公网IP的环境上部署,请谨慎做此设置(OLLAMA_HOST=0.0.0.0),否则可能导致 API 服务被恶意调用。" — 安全警示
|
||
|
||
## Key Concepts
|
||
- [[RAG]]:检索增强生成,通过 bge-m3 嵌入模型构建本地知识库,Open WebUI 支持该功能
|
||
- [[GGUF格式]]:Ollama 支持导入 GGUF 格式的本地模型文件(.gguf),用于离线部署
|
||
- [[API网关]]:通过 nginx 配置 Bearer Token 认证保护 ollama API 服务
|
||
|
||
## Key Entities
|
||
- [[Ollama]]:开源本地大语言模型运行框架,支持 macOS/Windows/Linux/Docker 多平台
|
||
- [[DeepSeek]]:专注 AGI 的中国科技公司,提供 DeepSeek-R1 系列开源推理模型
|
||
- [[Open WebUI]]:开源大模型 Web 界面,支持集成 ollama/OpenAI API,提供聊天机器人和 RAG 本地知识库功能
|
||
- [[Docker]]:容器化平台,用于部署 ollama 和 Open WebUI,实现环境隔离和便捷管理
|
||
- [[BGE-M3]]:多语言嵌入模型,用于 RAG 本地知识库的向量化嵌入
|
||
|
||
## Connections
|
||
- [[Ollama]] ← runs ← [[DeepSeek]]
|
||
- [[Ollama]] ← exposes API via ← [[API网关]]
|
||
- [[Open WebUI]] ← connects to ← [[Ollama]]
|
||
- [[RAG]] ← uses embedding model ← [[BGE-M3]]
|
||
- [[Docker]] ← hosts ← [[Ollama]]
|
||
- [[Docker]] ← hosts ← [[Open WebUI]]
|
||
|
||
## Contradictions
|
||
- 与 [[清华出的deepseek使用手册-104页-真的是太厉害了-免费领取]] 的侧重点:
|
||
- 冲突点:手册侧重 DeepSeek 模型使用技巧,本文侧重本地部署工程实践
|
||
- 当前观点:优先解决「如何本地运行」的基础设施问题
|
||
- 对方观点:侧重「如何用好模型」的提示词工程方法
|
||
- 说明:两者互补而非冲突,手册提供使用指南,本文提供部署指南
|