Files
nexus/wiki/sources/在Ubuntu安装Ollama并运行Qwen2.5-Coder7B.md

2.8 KiB
Raw Blame History

title, type, tags, date
title type tags date
在 Ubuntu 安装 Ollama 并运行 Qwen2.5-Coder 7B source
ollama
qwen
qwen-coder
ubuntu
本地AI
大语言模型
2025-01-15

Source File

Summary

  • 核心主题Ubuntu 本地部署 Ollama + Qwen2.5-Coder 7B 大语言模型推理服务
  • 问题域:如何在无 GPU 或有 NVIDIA GPU 的 Ubuntu 服务器上快速部署本地 AI 推理能力
  • 方法/机制Ollama 官方安装脚本 → systemd 服务管理 → REST API 暴露 → Python/NodeJS SDK 调用
  • 结论/价值3 条命令完成本地 AI 部署qwen2.5-coder:7b 比普通 qwen2.5:7b 更适合 DevOps/SQL/Kubernetes 等工程任务

Key Claims

  • Ollama 官方安装脚本自动完成 CLI 安装、systemd 服务创建和 API 启动
  • Qwen2.5-Coder 7B 模型大小约 4.5GB,最低 4 核 CPU + 8GB RAM无需 GPU 即可运行
  • NVIDIA GPU + CUDA 环境下 Ollama 自动使用 GPU 加速,无需额外配置
  • 开放远程 APIOLLAMA_HOST=0.0.0.0)后,可被 n8n/OpenClaw/OpenWebUI 等外部工具调用
  • Qwen2.5-Coder 在 Shell/Python/SQL 理解和 Repo 级代码理解上优于通用 Qwen2.5 模型

Key Quotes

"比普通 qwen2.5:7b 更适合工程任务" — 原因Tool usage 能力强、Shell/Python/SQL 理解强、Repo 级代码理解

Key Concepts

  • Ollama:本地大语言模型推理引擎,通过官方安装脚本一键部署,自动管理 systemd 服务
  • Qwen通义千问阿里巴巴开源大语言模型系列Qwen2.5-Coder 是其代码专精分支
  • 本地AI推理:在自有硬件上运行 LLM 推理,避免云服务依赖和 API 费用
  • GPU加速推理NVIDIA CUDA + Ollama 自动调度 GPU资源无需手动配置
  • REST API for LLMOllama 提供 http://localhost:11434 REST API支持 chat/completion/generate 端点

Key Entities

  • Ollama:本地 LLM 推理平台,安装地址 ollama.comCLI + REST API + SDK
  • Qwen阿里巴巴通义千问大模型家族Qwen2.5-Coder 是代码专精版本
  • Ubuntu目标服务器操作系统22.04/24.04 均支持
  • NVIDIA GPU:可选硬件加速,运行 nvidia-smi 验证 CUDA 环境

Connections

Contradictions

  • vLLMOllama 适合快速原型和轻量部署vLLM 适合高并发企业级服务,需要更多配置