广告
返回顶部
首页 > 资讯 > 操作系统 >Linux安装Pytorch1.8GPU(CUDA11.1)的实现
  • 245
分享到

Linux安装Pytorch1.8GPU(CUDA11.1)的实现

Linux安装PytorchGPUPytorchGPU安装 2022-06-04 23:06:54 245人浏览 八月长安
摘要

先说下自己之前的环境(都是linux系统,差别不大): Centos7.6 NVIDIA Driver Version 440.33.01(等会需要更新驱动) CUDA10.1 PyTorch1.6/1

先说下自己之前的环境(都是linux系统,差别不大):

  • Centos7.6
  • NVIDIA Driver Version 440.33.01(等会需要更新驱动)
  • CUDA10.1
  • PyTorch1.6/1.7

提示,如果想要保留之前的PyTorch1.6或1.7的环境,请不要卸载CUDA环境,可以通过Anaconda管理不同的环境,互不影响。但是需要注意你的NVIDIA驱动版本是否匹配。

在这里能够看到官方给的对应CUDA版本所需使用驱动版本。

cuda-driver

通过上表可以发现,如果要使用CUDA11.1,那么需要将显卡的驱动更新至455.23或以上(Linux x86_64环境)。由于我之前的驱动版本是440.33.01,那么肯定不满足,所以需要更新下显卡的驱动。通过以下指令可以查看你电脑上的驱动版本:


nvidia-smi

如果你的驱动版本是满足的,那么可以直接跳到创建Pytorch1.8虚拟环境章节。

更新驱动

卸载旧驱动

我之前安装的是NVIDIA-440的版本,找到之前下载的安装程序,然后打开终端通过以下指令进行卸载:


sh ./NVIDIA-Linux-x86_64-440.33.01.run --uninstall

安装新驱动

1)下载驱动,直接去NVIDIA官网下载:https://www.nvidia.cn/Download/index.aspx?lang=cn

driver

根据你的GPU型号以及操作信息选择对应的驱动,注意CUDA Toolkit11版的当前可选的只有11.0和11.2,而我们要装的是11.1所以选择11.2即可。

2)关闭Xserver服务 (如果没有安装桌面系统可以跳过)
我的桌面系统是gdm(GNOME Display Manager)类型的,通过systemctl可以看到:


systemctl status gdm.service

显示结果:

● gdm.service - GNOME Display Manager
Loaded: loaded (/usr/lib/systemd/system/gdm.service; enabled; vendor preset: enabled)
Active: active (running) since Fri 2021-01-22 09:27:06 CST; 1 months 22 days aGo
Process: 32347 ExecStartPost=/bin/bash -c TERM=linux /usr/bin/clear > /dev/tty1 (code=exited, status=0/SUCCESS)
Main PID: 32344 (gdm)
Tasks: 22
CGroup: /system.slice/gdm.service
├─32344 /usr/sbin/gdm
└─32357 /usr/bin/X :0 -background none -noreset -audit 4 -verbose -auth /run/gdm/auth-for-gdm-mBzawN/databa...

Jan 22 09:27:06 localhost.localdomain systemd[1]: Starting GNOME Display Manager...
Jan 22 09:27:06 localhost.localdomain systemd[1]: Started GNOME Display Manager.

关闭gdm服务:


systemctl stop gdm.service

注意,如果还开启了类似VNC远程桌面的服务也要记得关闭。

3)安装新版本驱动


sh ./NVIDIA-Linux-x86_64-460.32.03.run 

4)检查nvidia服务
通过以下指令能够看到当前主机上的nvidia驱动版本以及所有可用GPU设备信息。


nvidia-smi

5)再次开启桌面服务、VNC等
如果不是gdm或者不使用桌面环境可以跳过此步骤


systemctl start gdm.service

创建PyTorch1.8虚拟环境

为了不同版本之间的环境互相隔离,强烈建议使用Anaconda的虚拟环境。其实使用起来也非常简单:

创建虚拟环境,这里我创建了一个名为torch18的虚拟环境,并且创建python3.8的编译环境。


conda create -n torch18 python=3.8

安装完成后,激活虚拟环境


conda activate torch18

接着安装点常用的包,这里直接通过requirements.txt批量安装(不需要可以跳过)


pip install -r requirements.txt

requirements.txt文件里可以是你常用的一些包,例如:


numpy==1.17.0
matplotlib==3.2.1
lxml==4.6.2
tqdm==4.42.1

如果需要退出虚拟环境,执行以下指令即可:


conda deactivate

安装PyTorch1.8

在线安装

进入PyTorch官网:Https://pytorch.org/

pytorch

我们通过选择自己的系统类型、安装方式以及CUDA的版本可以得到对应的安装指令。官方默认会顺带安装torchvision和torchaudio但我只需要torchvision所以通过以下指令安装 (注意,要进入对应的虚拟环境安装,例如上面的torch18环境)


pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html

安装完成后就可以使用了,不需要在单独安装CUDA,并且不会影响之前安装的CUDA版本。

下面进行简单的测试

首先在终端输入Python进入python环境:


pyhton

然后导入torch包,查看cuda是否可用:


import torch
torch.cuda.is_available()

如果打印的是True表示成功

cuda

离线安装

有些时候,可能你的设备无法连接外网,此时需要提前准备好需要安装的whl文件,那么我们这里就以torchtorchvision为例(注意安装torch前需要提前安装好numpy包)。刚刚我们在线安装时发现安装指令最后有个网址,https://download.pytorch.org/whl/torch_stable.html,没错就是官方存放所有的安装包,所以我们可以直接去那里下载。

torchandvison

我们在这里可以找到我们需要的torch-1.8.0+cu111-cp38-cp38-linux_x86_64.whl以及torchvision-0.9.0+cu111-cp38-cp38-linux_x86_64.whl两个文件即可。注意,cu111代表CUDA11.1,cp38表示python3.8的编译环境,linux_x86_64表示x86的平台64位操作系ExCDLUVYMD统。下载完成后,我们将这两个文件传入你的离线主机(服务器)中。接着在保存这两个文件夹的目录下打开终端:

进入对应虚拟环境


conda activate torch18

安装torch


pip install torch-1.8.0+cu111-cp38-cp38-linux_x86_64.whl

安装torchvison


pip install torchvision-0.9.0+cu111-cp38-cp38-linux_x86_64.whl

安装完成后进行简单的测试:

首先在终端输入python进入python环境:


pyhton

然后导入torch包,查看cuda是否可用:


import torch
torch.cuda.is_available()

如果打印的是True表示成功

cuda

通过Docker安装

在有些情况下是需要使用docker来跑深度学习环境的(现在很多大公司都是使用paas平台来部署的)。那么我们就需要使用pytorch官方的docker镜像了。我们可以在docker hub上去搜索相关镜像,https://reGIStry.hub.docker.com/。下图是我搜索的pytorch字段的结果(点击Tags后)。

docker

我们可以看到当前最新的docker 镜像有pytorch/pytorch:1.8.0-cuda11.1-cudnn8-develpytorch/pytorch:1.8.0-cuda11.1-cudnn8-runtime,对于普通开发者下载pytorch/pytorch:1.8.0-cuda11.1-cudnn8-runtime就行了。关于安装docker的过程这里不赘述。

1)我们直接通过以下指令就能pull这个镜像了


docker pull pytorch/pytorch:1.8.0-cuda11.1-cudnn8-runtime

2)注意,在启动镜像前需要确保已安装NVIDIA Container Toolkit,否则会报错(若已安装可直接跳过此步骤):


distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
  && curl -s -L https://nvidia.GitHub.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo

安装NVIDIA Container Toolkit,参考官方文档:https://github.com/NVIDIA/nvidia-docker
这里以Centos7为例:

首先根据你的系统类型以及版本下载对应.repo文件到/etc/yum.repos.d


distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
  && curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo

清空yum的过期缓存数据(如果不是root用户需要加sudo)


yum clean expire-cache

安装NVIDIA Container Toolkit(如果不是root用户需要加sudo)


yum install -y nvidia-docker2

重启docker服务(如果不是root用户需要加sudo)


systemctl restart docker

3)通过docker启动pytorch1.8.0容器


docker run --gpus alExCDLUVYMDl --rm -it --ipc=host pytorch/pytorch:1.8.0-cuda11.1-cudnn8-runtime

4)进入容器后可以通过nvidia-smi看到所有的GPU设备信息

smi

5)接着进入python环境简单测试下pytorch能否正常调用GPU(打印True为成功)


import torch
torch.cuda.is_available()

test

到此这篇关于Linux安装Pytorch1.8GPU(CUDA11.1)的实现的文章就介绍到这了,更多相关Linux安装Pytorch GPU 内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

--结束END--

本文标题: Linux安装Pytorch1.8GPU(CUDA11.1)的实现

本文链接: https://www.lsjlt.com/news/21293.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Linux安装Pytorch1.8GPU(CUDA11.1)的实现
    先说下自己之前的环境(都是linux系统,差别不大): Centos7.6 NVIDIA Driver Version 440.33.01(等会需要更新驱动) CUDA10.1 Pytorch1.6/1...
    99+
    2022-06-04
    Linux安装Pytorch GPU Pytorch GPU安装
  • Linux下安装nginx的实现方法
    Nginx 是 C语言 开发,建议在 linux 上运行,当然,也可以安装 Windows 版本, 安装依赖 yum install gcc yum install pcre-devel yum install zl...
    99+
    2022-06-04
    Linux安装nginx
  • linux 安装setup.py程序的实现方法
    首先执行命令: [root@mini61 setuptools-8.2.1]# python setup.py buOxVpYnild 再执行命令: [root@mini61 setuptools-8.2.1]# pyt...
    99+
    2022-06-04
    linux 安装 setup.py
  • Linux下实现SNMP一键安装的Shell脚本
    Net-SNMP是一个免费的、开放源码的SNMP实现,以前称为UCD-SNMP。SNMP 很多都用其安装之后,作为监控宝和阿里云的系统信息监控使用。下面就来分享linux下实现SNMP一键安装的shell脚...
    99+
    2022-06-04
    一键 脚本 Linux
  • 如何实现linux系统软件安装
    小编今天带大家了解如何实现linux系统软件安装,文中知识点介绍的非常详细。觉得有帮助的朋友可以跟着小编一起浏览文章的内容,希望能够帮助更多想解决这个问题的朋友找到问题的答案,下面跟着小编一起深入学习“如何实现linux系统软件安装”的知识...
    99+
    2023-06-28
  • linux中mysql如何实现离线安装
    这篇文章将为大家详细讲解有关linux中mysql如何实现离线安装,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。[root@hadoop-01 ~]# cd /usr/l...
    99+
    2022-10-18
  • Linux如何实现优盘引导安装
    这篇文章主要为大家展示了“Linux如何实现优盘引导安装”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Linux如何实现优盘引导安装”这篇文章吧。一、可引导优盘制作概述毫无疑问,从优盘引导是非常...
    99+
    2023-06-16
  • Linux CentOS7 的安装
    实现步骤如下 点击文件顶部导航条文件 ---> 新建虚拟机 ---> 选择典型,当然你也可以选择自定义,个人觉得典型好点   选择销后安装镜像   解这选择Linux 下面选择CentOS64 位   自定义虚拟机名称 和...
    99+
    2017-04-01
    Linux CentOS7 的安装
  • Oracle linux的安装
    第一步 操作系统安装第二步 防火墙设置第三步 SELinux设置一、操作系统安装:nextthe differences between "Basic Storage Devicec" and "Speci...
    99+
    2022-10-18
  • linux的安装3.7python
    centos安装python31) 首先安装依赖包 yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-de...
    99+
    2023-01-31
    linux python
  • linux下安装配置Memcache和PHP环境的实现
    亲测有效 在网上查找了好多资料,很多都安装不成功,而且都是同一个资料相互抄袭泛蓝,没一个实用的。今天配置好了,将配置过程分享一下。 Linux下的Memcache运行需要libevent的支持,所以在安装m...
    99+
    2022-06-04
    环境 linux Memcache
  • 基于cobbler 实现自动安装linux系统
    1.安装个组件 yum install epel-rpm-macros.noarch -y #安装epel源 yum install -y cobbler cobbler-web dhcp tftp-server p...
    99+
    2022-06-04
    cobbler 安装linux linux系统安装
  • 怎么实现windows和linux双系统安装
    本文小编为大家详细介绍“怎么实现windows和linux双系统安装”,内容详细,步骤清晰,细节处理妥当,希望这篇“怎么实现windows和linux双系统安装”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。1.U...
    99+
    2023-06-27
  • 怎么实现linux软件安装与卸载
    本篇文章为大家展示了怎么实现linux软件安装与卸载,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。Linux系统中常用的软件安装方式有二进制形式的软件分发、源代码形式的软件包。二进制分发软件包的安装...
    99+
    2023-06-28
  • linux安装RocketMQ实例步骤
    1.安装JDK 1.1 检查当前虚拟机环境有没有JDK   rpm -qa|grep jKaapjtava 1.2 卸载  rpm -e --nodeps xxxxxx(自己的openjdk...
    99+
    2022-06-04
    linux RocketMQ
  • Linux环境MySQL5.6安装实践
          MySQL的安装相对于Oracle来说非常简单,个人觉得与TimesTen的安装配置更为接近,而且后面的Master-Slave或Master-Master集群配置...
    99+
    2022-10-18
  • Linux下安装并实用Squid
    这篇文章主要介绍Linux下安装并实用Squid,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!Squid是一个流行的自由软件(GNU通用公共许可证)的代理服务器和Web缓存服务器。安装和配置使用 sudo 安装 sq...
    99+
    2023-06-27
  • linux安装mongodb实例分析
    这篇“linux安装mongodb实例分析”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“linux安装mongodb实例分析...
    99+
    2023-06-30
  • Linux安装Docker实例分析
    这篇文章主要讲解了“Linux安装Docker实例分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Linux安装Docker实例分析”吧!介绍Docker利用Linux核心中的资源分脱机制...
    99+
    2023-07-02
  • 在linux系统下安装python librtmp包的实现方法
    安装librtmp包需要依赖环境较多,机器上已经安装了python2.7版本,安装librtmp包之前需要先安装依赖环境。 1、安装gcc和依赖包 yum install gcc* python-devel lib...
    99+
    2022-06-04
    linux 安装 python librtmp包
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作