---
title: "Ollama"
type: entity
tags: []
last_updated: 2026-04-23
---

# Ollama

## Overview
Ollama 是一个开源的本地大语言模型（LLM）运行框架，让用户可以在本地机器上部署和运行大型语言模型，实现**免费离线使用 LLM 能力**，同时确保私有数据的隐私和安全性。

## Aliases
- Ollama
- ollama

## Key Facts
- **官网**: https://ollama.com
- **中文站**: https://ollama.org.cn
- **GitHub**: https://github.com/ollama/ollama
- **支持平台**: macOS, Windows, Linux, Docker
- **API 端口**: localhost:11434

## Supported Models
- DeepSeek-R1 系列（1.5B ~ 671B 参数）
- Qwen 系列
- Llama 系列
- 第三方模型（HuggingFace、魔塔社区）

## Core Commands
| 命令 | 功能 |
|------|------|
| `ollama run <model:size>` | 下载并运行模型 |
| `ollama pull <model:size>` | 拉取模型 |
| `ollama create <name> -f <Modelfile>` | 从 Modelfile 导入本地 GGUF 模型 |
| `ollama list` | 列出所有已下载模型 |
| `ollama ps` | 列出正在运行的模型 |
| `ollama serve` | 启动 Ollama 服务 |

## Hardware Requirements
| 模型 | 建议内存 | 建议显存 | 适用场景 |
|------|---------|---------|---------|
| 1.5B | 4~8 GB | 4 GB | 轻量快速 |
| 7B | 16 GB | 14 GB | 日常使用 |
| 8B | 16 GB | 14 GB | 较高精度 |
| 14B | 32 GB | 26 GB | 复杂任务 |
| 32B | 64 GB | 48 GB | 专业级 |
| 70B+ | 128+ GB | 140+ GB | 超大规模 |

## Docker Deployment
```bash
# CPU 模式
docker run -d -p 11434:11434 -v /data/ollama:/root/.ollama --name ollama ollama/ollama

# GPU 模式
docker run --gpus=all -d -p 11434:11434 -v /data/ollama:/root/.ollama --name ollama ollama/ollama
```

## Environment Variables
| 变量 | 默认值 | 说明 |
|------|--------|------|
| OLLAMA_MODELS | ~/.ollama/models | 模型存储路径 |
| OLLAMA_HOST | 127.0.0.1 | 服务绑定地址 |
| OLLAMA_ORIGINS | * | 允许的来源域名 |

## Key Concepts
- [[Local LLM Deployment]]：Ollama 是实现本地 LLM 部署的核心工具
- [[Docker LLM Deployment]]：Ollama 支持 Docker 部署模式
- [[Model Quantization]]：GGUF 格式量化模型可通过 `ollama create` 导入

## Related Entities
- [[DeepSeek]]：Ollama 官方支持的深度求索推理模型
- [[Open WebUI]]：基于 Ollama API 的开源 Web 界面
- [[HuggingFace]]：第三方模型来源

## Sources
- [[详细-离线部署大模型-ollama-deepseek-open-webui安装使用方法及常见问题解决-1]]