iis服务器助手广告
返回顶部
首页 > 资讯 > 服务器 >ubuntu服务器关机重新开机之后nvidia-smi不显示但nvcc -C没问题
  • 502
分享到

ubuntu服务器关机重新开机之后nvidia-smi不显示但nvcc -C没问题

ubuntulinux运维 2023-09-06 21:09:53 502人浏览 安东尼
摘要

安装stable diffusion WEBui过程中发现的问题。 出现报错: AssertionError: Torch is not able to use GPU; add --skip-torch-cuda-test to COMM

安装stable diffusion WEBui过程中发现的问题。

出现报错:

AssertionError: Torch is not able to use GPU; add --skip-torch-cuda-test to COMMANDLINE_ARGS variable to disable this check

然后来看nvidia-smi 的时候发现驱动挂了

nvcc -V,查看cuda是可以看到的

说明之前至少安装cuda的时候没挂,应该是服务器启动的问题。

  检查了一下 

# whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-450.102.04/nvidia

# dkms status
nvidia, 450.102.04, 5.4.0-132-generic, x86_64: installed

说明驱动已经安装。不然的话可以用这个解决方案: 

sudo apt-get install dkms #DKMS全称是Dynamic Kernel Module Support,它可以帮我们维护内核外的这些驱动程序,在内核版本变动之后可以自动重新生成新的模块。sudo dkms install -m nvidia -v 410.78 #410.78是安装驱动的版本

 ubuntu关机开机后显卡挂了:报错NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. M... - 简书 (jianshu.com)(138条消息) NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver._nvdia-smi has failed_AI 菌的博客-CSDN博客

原因:linux系统内核更新和nvidia驱动不适配

4. 解决方案:

(138条消息) 显卡驱动报错:NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver._显卡报错命令是什么_oyrq的博客-CSDN博客

 期间遇到了另一个问题:


# sudo dkms install -m nvidia -v 450.102.04
Error! Your kernel headers for kernel 5.4.0-144-generic cannot be found.
Please install the linux-headers-5.4.0-144-generic package,
or use the --kernelsourcedir option to tell DKMS where it's located

检查了一下确实没装:

# dpkg-query -s linux-headers-5.4.0-144-generic
dpkg-query: package 'linux-headers-5.4.0-144-generic' is not installed and no infORMation is available
Use dpkg --info (= dpkg-deb --info) to examine arcHive files.

(138条消息) Linux如何查看内核版本并安装内核头文件linux-headers-generic_高精度计算机视觉的博客-CSDN博客

安装:

 sudo apt-get install linux-headers-$(uname -r)

5. 最后再看nvidia-smi就没问题了

​编辑

进而也可以去解决下一个安装stabel diffusion时出现的bug了:)

来源地址:https://blog.csdn.net/weixin_42735060/article/details/130323696

--结束END--

本文标题: ubuntu服务器关机重新开机之后nvidia-smi不显示但nvcc -C没问题

本文链接: https://www.lsjlt.com/news/397581.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作