Ubantu18-04安装NVIDIA驱动-cuda10-1-cuDNN-Tensorflow2-1-0

注意:TensorFlow2.1 要求 你的GPU算力要达到3.5,检查自己GPU算力

安装和卸载NVIDIA驱动

首先要确保驱动已经卸载干净

1
2
sudo apt-get purge nvidia*
sudo apt-get autoremove

检查自己GPU版本,之后到官网去下载,这种办法安装比较稳妥,其他网络安装办法有时候出错不知道咋回事。

1
lshw -numeric -C display

下载驱动网址:https://www.nvidia.cn/Download/index.aspx?lang=cn

禁用Nouveau

1
2
3
4
5
6
7
8
9
10
11
12
13
14
Nouveau驱动禁用方法:

sudo gedit /etc/modprobe.d/blacklist.conf
或者
sudo vim /etc/modprobe.d/blacklist.conf

在最后两行添加:

blacklist nouveau
options nouveau modeset=0 // 禁用nouveau第三方驱动,之后也不需要改回来

执行

sudo update -initramfs -u // 更新内核

关闭lightdm

1
2
3
4
5
6
7
sudo service lightdm stop

 sudo init 3 # 遇见X Server报错执行

rm -rf /tmp/.X*

./NVIDIA-Linux-x86_64-418.165.02.run #开始安装驱动 遇见continue就continue 遇见ok就ok

安装cuda10.1

https://tensorflow.google.cn/install/source#linux

在这个网站上对好版本,版本不对可不行,全是坑

https://developer.nvidia.com/cuda-toolkit-archive 选择版本

然后在这里下载cuda 我用的是deb的办法也是本地下载后安装的。(我这个网络可能是不行,总是apt-get update 总是报错 所以这个方法没成功用runfile成功了。。。)参考一下吧

安装

1
2
3
4
5
sudo dpkg -i cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub
sudo dpkg -i cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda

添加环境变量:

打开 .bashrc

sudo vim ~/.bashrc

1
2
3
export CUDA_HOME=/usr/local/cuda 
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

source ~/.bashrc

nvcc -V

runfile安装cuda

下载runfile

一定要取消掉driver 此处!!!,因为已经装了驱动了

1
sudo vim ~/.bashrc

我们在文件最后一行添加:

1
2
3
$ export PATH=/usr/local/cuda-10.1/bin:/usr/local/cuda-10.1/NsightCompute-2019.1${PATH:+:${PATH}}
$ export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64\
${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
1
source ~/.bashrc

安装TensorFlow2.1.0_gpu

这上面虽然没写2.1.0_gpu 可是还得得装gpu版

完成后

conda install cudatoolkit=10.1

安装cuDNN

https://developer.nvidia.com/cudnn

去下载对应版本,但是要登录一下

解压后

1
2
3
4
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

以配置cuDNN环境。

通过

1
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

查看cuDNN版本

over