news 2026/6/23 19:37:56

Docker+vLLM内网离线部署Qwen3 流程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Docker+vLLM内网离线部署Qwen3 流程

Docker + vLLM 内网离线部署 Qwen3-32B 完整教程

环境准备

Nvidia显卡驱动、CUDA、nvidia-container安装
参考:http:
Docker环境安装
参考:http:

注意:在进行VLLM容器化部署之前,需要确保已在服务器上安装了Docker 和
Nvidia显卡驱动、CUDA、nvidia-container。

一、部署流程概述

部署流程主要分为三个关键步骤:

  1. 准备vLLM镜像- 在联网环境下载并导入内网
  2. 获取模型文件- 从模型仓库下载Qwen3-32B模型
  3. 启动推理服务- 使用Docker运行vLLM服务

下面详细介绍每个步骤的具体操作。

二、详细操作步骤

1. 离线获取 vLLM 镜像

由于内网服务器无法直接访问Docker Hub,需要在有网络的机器上先拉取镜像,然后传输到内网服务器。

在可联网的机器上执行:

# 拉取官方vLLM镜像(大小约20GB,下载需要较长时间)docker pull vllm/vllm-openai# 将镜像打包保存为文件docker save -o vllm-openai-image.tar vllm/vllm-openai:latest

在内网服务器上执行:

# 进入保存镜像文件的目录cd/data# 从文件加载镜像到本地Dockerdocker load<vllm-openai-image.tar# 验证镜像是否加载成功(应该能看到vllm/vllm-openai镜像)docker images|grepvllm-openai

2. 下载 Qwen3-32B 模型文件

模型可以从以下几个平台下载(推荐使用国内源提升下载速度):

  • Hugging Face Hub(国内镜像):https://hf-mirror.com/
  • ModelScope 魔搭社区:https://www.modelscope.cn/models
  • GitCode:https://gitcode.net/

本文以魔搭社区为例,使用git下载:

# 确保已安装git-lfs(大文件支持)gitlfsinstall# 克隆模型仓库(模型大小约62GB,下载需要很长时间)gitclone https://www.modelscope.cn/Qwen/Qwen3-32B.git

下载完成后,将整个模型文件夹复制到内网服务器的/data/Qwen3-32B目录下。

3. 启动 vLLM 推理服务

使用以下命令启动服务容器,请根据实际情况调整参数:

docker run -d --privileged --gpus all\--restart unless-stopped\--networkhost\-v /data/Qwen3-32B:/app/model\--shm-size 32G\--name vllm-qwen3\vllm/vllm-openai:latest\--model /app/model\--served-model-name qwen3:32b
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 19:33:10

基于vue的家政服务管理系统_37cw9ju0_springboot php python nodejs

目录具体实现截图项目介绍论文大纲核心代码部分展示项目运行指导结论源码获取详细视频演示 &#xff1a;文章底部获取博主联系方式&#xff01;同行可合作具体实现截图 本系统&#xff08;程序源码数据库调试部署讲解&#xff09;同时还支持java、ThinkPHP、Node.js、Spring B…

作者头像 李华
网站建设 2026/6/23 17:39:52

《零基础学 PHP:从入门到实战》·PHP编程精进之路:掌握高级特性与实战技巧-1

第1章:面向对象编程进阶 章节介绍 学习目标: 深入掌握PHP面向对象编程(OOP)的核心与高级机制.你将不再满足于创建简单的类,而是学会运用静态成员、继承、多态、抽象与接口来设计松耦合、高复用的架构.本章将解锁"魔术方法"的奥秘,让你能够优雅地处理对象生命周期与动…

作者头像 李华
网站建设 2026/6/22 5:40:06

Step-Audio 2:重新定义人机语音交互的技术革命

当语音助手仍停留在简单问答阶段&#xff0c;当智能设备只能机械执行指令&#xff0c;当跨语言交流仍充满障碍&#xff0c;我们是否在期待一个真正能"听懂"人类声音的AI伙伴&#xff1f;Step-Audio 2系列模型的诞生&#xff0c;正在为这个期待给出肯定答案。 【免费下…

作者头像 李华
网站建设 2026/6/23 3:02:52

AutoGPT与Stable Diffusion联用:图文内容协同生成新玩法

AutoGPT与Stable Diffusion联用&#xff1a;图文内容协同生成新玩法 在内容创作的战场上&#xff0c;效率就是生命线。一条社交媒体推文从构思到发布&#xff0c;往往需要文案、设计师、审核三轮协作&#xff0c;耗时数小时甚至数天。而今天&#xff0c;一个AI系统可以在几分钟…

作者头像 李华
网站建设 2026/6/23 19:32:26

NetSonar:3分钟快速掌握的网络诊断终极方案

NetSonar&#xff1a;3分钟快速掌握的网络诊断终极方案 【免费下载链接】NetSonar Network pings and other utilities 项目地址: https://gitcode.com/gh_mirrors/ne/NetSonar 你是否曾经遇到过这样的困扰&#xff1a;网络突然变慢&#xff0c;却不知道问题出在哪里&am…

作者头像 李华
网站建设 2026/6/23 4:05:17

46、PHP 基础函数与操作全解析

PHP 基础函数与操作全解析 在 PHP 编程的世界里,有许多强大的内置函数和操作方法能帮助我们更高效地完成各种任务。下面我们将详细介绍一些常用的函数和操作。 包含文件与数据共享 首先来看一个简单的文件包含示例。将以下脚本保存为 echo_i.php : <?php echo $i;…

作者头像 李华