--- title: "Docker LLM Deployment" type: concept tags: [] last_updated: 2026-04-23 --- # Docker LLM Deployment ## Definition 通过 Docker 容器化方式部署本地大语言模型运行时(LLM)及其周边工具(Web 界面、RAG 引擎等),实现环境隔离、可移植性和便捷管理的部署模式。 ## Core Patterns ### Pattern 1: Ollama 独立容器 ```bash # CPU 模式 docker run -d -p 11434:11434 \ -v /data/ollama:/root/.ollama \ --name ollama ollama/ollama # GPU 模式(需 nvidia-container-toolkit) docker run --gpus=all -d -p 11434:11434 \ -v /data/ollama:/root/.ollama \ --name ollama ollama/ollama ``` ### Pattern 2: Ollama + Open WebUI 联合部署 ```yaml services: ollama: image: ollama/ollama volumes: - /data/ollama:/root/.ollama # GPU 模式 deploy: resources: reservations: devices: - driver: nvidia count: all capabilities: [gpu] open-webui: image: ghcr.io/open-webui/open-webui:main environment: - OLLAMA_API_BASE_URL=http://ollama:11434/api ports: - 8080:8080 depends_on: - ollama ``` ## Key Advantages | 优势 | 说明 | |------|------| | 环境隔离 | 避免依赖冲突,不污染宿主机 | | GPU 直通 | `--gpus=all` 直接利用宿主 GPU | | 便捷迁移 | 镜像导出/导入实现跨机器部署 | | 统一管理 | `docker compose up/down` 控制启停 | | 卷挂载 | 模型数据持久化到宿主机目录 | ## Key Environment Variables | 变量 | 说明 | 示例 | |------|------|------| | OLLAMA_MODELS | 模型存储路径 | `/data/ollama/models` | | OLLAMA_HOST | API 绑定地址 | `0.0.0.0:11434` | | OLLAMA_ORIGINS | 允许的跨域来源 | `*` | | HF_ENDPOINT | HuggingFace 镜像 | `https://hf-mirror.com` | ## China Environment Best Practices - 设置 `HF_ENDPOINT=https://hf-mirror.com` 加速镜像拉取 - 预先拉取镜像:`docker pull ollama/ollama ghcr.io/open-webui/open-webui:main` - 通过 volume 挂载宿主机模型目录避免重复下载 - 模型目录规划:`/data/ollama/models` 集中管理所有 GGUF 文件 ## Related Concepts - [[Local LLM Deployment]]:Docker 部署是本地 LLM 的一种实现方式 - [[Ollama]]:Ollama Docker 镜像是核心运行时 - [[Open WebUI]]:Ollama 的 Web 界面伴侣 ## Sources - [[详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决-1]]