Files
nexus/wiki/concepts/Docker-LLM-Deployment.md
2026-04-23 05:51:04 +08:00

2.4 KiB
Raw Blame History

title, type, tags, last_updated
title type tags last_updated
Docker LLM Deployment concept
2026-04-23

Docker LLM Deployment

Definition

通过 Docker 容器化方式部署本地大语言模型运行时LLM及其周边工具Web 界面、RAG 引擎等),实现环境隔离、可移植性和便捷管理的部署模式。

Core Patterns

Pattern 1: Ollama 独立容器

# CPU 模式
docker run -d -p 11434:11434 \
  -v /data/ollama:/root/.ollama \
  --name ollama ollama/ollama

# GPU 模式(需 nvidia-container-toolkit
docker run --gpus=all -d -p 11434:11434 \
  -v /data/ollama:/root/.ollama \
  --name ollama ollama/ollama

Pattern 2: Ollama + Open WebUI 联合部署

services:
  ollama:
    image: ollama/ollama
    volumes:
      - /data/ollama:/root/.ollama
    # GPU 模式
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    environment:
      - OLLAMA_API_BASE_URL=http://ollama:11434/api
    ports:
      - 8080:8080
    depends_on:
      - ollama

Key Advantages

优势 说明
环境隔离 避免依赖冲突,不污染宿主机
GPU 直通 --gpus=all 直接利用宿主 GPU
便捷迁移 镜像导出/导入实现跨机器部署
统一管理 docker compose up/down 控制启停
卷挂载 模型数据持久化到宿主机目录

Key Environment Variables

变量 说明 示例
OLLAMA_MODELS 模型存储路径 /data/ollama/models
OLLAMA_HOST API 绑定地址 0.0.0.0:11434
OLLAMA_ORIGINS 允许的跨域来源 *
HF_ENDPOINT HuggingFace 镜像 https://hf-mirror.com

China Environment Best Practices

  • 设置 HF_ENDPOINT=https://hf-mirror.com 加速镜像拉取
  • 预先拉取镜像:docker pull ollama/ollama ghcr.io/open-webui/open-webui:main
  • 通过 volume 挂载宿主机模型目录避免重复下载
  • 模型目录规划:/data/ollama/models 集中管理所有 GGUF 文件

Sources