意见箱
恒创运营部门将仔细参阅您的意见和建议,必要时将通过预留邮箱与您保持联络。感谢您的支持!
意见/建议
提交建议

Dell G3 搭建深度学习环境(Ubuntu16.04)

来源:恒创科技 编辑:恒创科技编辑部
2022-09-22 00:35:00


文章目录​​一、Ubuntu16.04 系统安装​​​​前言:​​​​1.1 准备阶段​​​​1.2 安装阶段​​​​二、Ubuntu16.04 nvidia显卡驱动​​​​2.1. 禁用nouveau开源驱动​​​​2.2 安装nvidia显卡驱动​​​​三、Ubuntu16.04 CUDA安装​​​​3.2 环境变量配置​​​​3.3 编译cuda 测试​​​​3.4 cudnn安装​​​​四、搭建 Anaconda深度学习虚拟环境​​​​4.1 下载并安装Anaconda​​​​4.2 搭建虚拟环境​​​​4.3 安装pycharm​​一、Ubuntu16.04 系统安装前言:


windows 10 64位系统


Dell G3 搭建深度学习环境(Ubuntu16.04)

CPU:i5-8300H


显卡:GTX1050Ti


硬盘:C盘(Windows10系统盘)128G固态硬盘


D盘(DATA)1T机械硬盘


1.1 准备阶段

Ubuntu16.04系统镜像文件下载地址:
官网:http://www.ubuntu.org.cn/download/alternative-downloads
清华镜像站:https://mirrors.tuna.tsinghua.edu.cn/ubuntu-releases/16.04.6/
制作U盘启动盘(U盘容量最好大于8G,制作方法​​​可以参考这个​​​ 或自行百度)
UltraISO软碟通下载地址:https://cn.ultraiso.net/xiazai.html

在Windows 操作系统下面进行磁盘分区:(本人在1T的机械硬盘上压缩了100G)
右击【计算机】-> 点击【管理】-> 点击左侧【磁盘管理】-> 选中磁盘【压缩卷】->完成(无需格式化)

1.2 安装阶段插入U盘开机按F2 键进入BIOS界面,然后只需要做两步:
一是将Boot Security Mode 改为Disabled
二是将系统启动优先项改为 U盘启动即可。
点击 Apply ,再点击Exit (其他都不需要设置了)。进入Ubuntu安装界面的,但是由于显卡存在冲突,需要再进一步对电脑进行设置
按方向键选中​​Install Ubuntu​​,需要按“e”进入编辑界面,如果不进入,那么系统将无法顺利装成功,可能会卡在安装界面处,进不了分区界面。
编辑如下:
在splash后面(注意有空格,如果是‘’—‘’,则需要把这三个虚杠删除掉)再加上​​nouveau.modeset=0​​这个语句,然后按f10或者Ctrl+x,进入Ubuntu,这样就正式进入安装界面。在安装界面-安装类型界面
若直接选择第一项(安装Ubuntu,与windows Boot Manager共存)则省心安装成功。以下步骤跳过。
若选择 ‘其他选项’ 点击继续就是对系统进行分区(可定制性强)
对Linux系统进行分区(主要分为5个区),这一步非常重要!!!系统分区
选中刚才压缩卷,点击左下角的‘+’创建分区​swap 交换分区​​(分区类型:主分区;新分区位置:空间起始位置;用于交换空间。点击确定。)
分区大小最好与电脑运行内存一样大,本人分配16G​/ 根分区​​(分区类型:逻辑分区;新分区位置为空间起始位置;用于Ext4日志文件系统;挂载点 “/”。点击确定。)
本人分配16G(大小随意,但是不能太小,也不要太大)​EFI系统分区​​(分区类型:逻辑分区;新分区位置为空间起始位置;挂载点 “/EFI系统分区”。点击确定。)
本人分配:512MB(在256~512MB之间);
由于Dell G3的系统模式本身为UEFI模式,我们直接在Ubuntu下直接创建另一个EFI系统分区就行​home分区​​(分区类型为逻辑分区;新分区位置为空间起始位置;用于Ext4日志文件系统;挂载点 “/home”。点击确定。)
本人分配:35G(越大越好,用于存放用户文件等资料);​usr分区​​(分区类型为逻辑分区;新分区位置为空间起始位置;用于Ext4日志文件系统;挂载点 “/usr”。点击确定。)
本人分配:43G(剩下的都给usr区);选择安装启动引导器的设备:
若你选择默认的(显示1T的机械硬盘)直接安装即可。
我当时看某博主博文选择了 与“EFI系统区”所对应的设备,就是刚刚分配的EFI系统分区所对应的设备是:/dev/sda6。然后出现5个分区之后,就点击确定进行安装,安装完之后,直接点击重启。结果出现引导失败(直接进入win10了),我试过用EasyBCD软件然而其无法引导UEFI的。从此进入了一条漫长的引导修复之路。引导修复之路(若你也遇到以下问题,仅供参考)
方法一:我查网上资料:安装了easyUEFI 安装博客说明,结果引导修复失败。
方法二:于是我插入U盘启动盘,优先选择U盘启动,选择​​Try ubuntu without install​​ 进入Ubuntu系统后,打开终端,并输入以下命令:(确保网络稳定通畅,否则想死的心都有了)
$ sudo su
# sudo add-apt-repository ppa:yannubuntu/boot-repair
# apt-get update
# apt-get install boot-repair

在dash中搜索boot-repair。点recommand repair,之后会自动执行。

Dell G3 搭建深度学习环境(Ubuntu16.04)_重启


好了重启。开机之后,会出现类似于这样一个界面,发现多了很多不必要的选项。

删掉多余的就好,执行以下命令

su                                                # 获取root权限
cp /boot/grub/grub.cfg /boot/grub/grub.cfg_backup  # 先备份一下
cat /boot/grub/grub.cfg > tmp   #将内容重定向到其他文件,便于修改
gedit tmp   #或者vi/vim tmp

#将下面这些内容全部删掉
### BEGIN /etc/grub.d/25_custom ###
menuentry "Windows UEFI bootmgfw.efi" {
search --fs-uuid --no-floppy --set=root 84F5-6727
chainloader (${root})/EFI/Microsoft/Boot/bootmgfw.efi
}
menuentry "Windows Boot UEFI loader" {
search --fs-uuid --no-floppy --set=root 84F5-6727
chainloader (${root})/EFI/Boot/bkpbootx64.efi
}
...
menuentry "Windows Boot UEFI recovery bkpbootx64.efi" {
search --fs-uuid --no-floppy --set=root 5686-D913
chainloader (${root})/efi/Boot/bkpbootx64.efi
}
### END /etc/grub.d/25_custom ###
其实就是删掉对应的中间那几项
删掉之后再:
cat tmp > /boot/grub/grub.cfg
reboot

祝你好运:关于详情请参考:https://www.cnblogs.com/lymboy/p/7783756.html

方法三:若你同我一样,在修复阶段失败了,报了如下错误,请继续看:

An error occurred during the repair.

Please write on a paper the following URL:
http://paste.ubuntu.com/p/bhrJFR5TGJ/

In case you still experience boot problem, indicate this URL to:
boot.repair@gmail.com

You can now reboot your computer.
Please do not forget to make your BIOS boot on nvme0n1p1/EFI/ubuntu/grubx64.efi file!

If your computer reboots directly into Windows, try to change the boot order in your BIOS.
If your BIOS does not allow to change the boot order, change the default boot entry of the Windows bootloader.
For example you can boot into Windows, then type the following command in an admin command prompt:
bcdedit /set {bootmgr}

关机返回到Windows 10
右击开始按钮,选择Windows PowerShell管理员命令行(或者搜索cmd 以管理员身份运行)
执行:

mountvol g: /s  # 这将你的EFI目录结构映射到G盘
g: # 进入g盘
cd \EFI # 进入EFI文件夹
dir # 查看该文件夹
bcdedit /set {bootmgr} path \EFI\ubuntu\grubx64.efi # 复制上述的报错命令

重启你的电脑

若你将会看到一个包含Ubuntu和Windows选项的GRUB菜单(恭喜修复成功)

如果你的电脑仍然直接启动到Windows,重复如下截图步骤,但是这次输入: bcdedit /set {bootmgr} path \EFI\ubuntu\shimx64.efi

Dell G3 搭建深度学习环境(Ubuntu16.04)_ubuntu_02


重启你的电脑(若你执行两次同我一样都是直接进入Windows10,请往下看)

方法四:到了这里,相信你的心情同我一样了,来到终极必杀技:重装系统(是不是很简单!)

我当时也是无法了,插入U盘启动盘,重启机器按F2,选择​​install ubuntu​​,在安装选项这一部分,选择覆盖安装,等待其安装完成。

这一次启动项终于修复好了。

二、Ubuntu16.04 nvidia显卡驱动

安装好Ubuntu16.04后,我们可以安装深度学习环境了。
由于ubuntu 16.04默认安装了第三方开源的驱动程序nouveau。为了避免sudo apt-get install nvidia-*安装方式造成登录界面循环或者导致无法安装nvidia显卡驱动。需要禁用nouveau

2.1. 禁用nouveau开源驱动编辑文件blacklist.conf
sudo vi
在文件最后部分插入以下两行内容:
blacklist nouveau
options nouveau modeset=0
执行以下命令,更新系统
sudo
重启系统(一定要重启)验证nouveau是否已禁用
lsmod | grep

若没有信息输出,说明nouveau已被禁用,接下来安装nvidia的显卡驱动。

2.2 安装nvidia显卡驱动英伟达的官网上查找你自己电脑的显卡型号然后下载相应的驱动:https://www.geforce.cn/drivers
下载至home目录下。(目录自定义,但是不要有中文)

Dell G3 搭建深度学习环境(Ubuntu16.04)_ubuntu_03

在ubuntu下按​​ctrl+alt+f1​​进入命令行界面。(​​ctrl+alt+f7​​返回桌面)
登陆后,然后在命令行界面下输入:
sudo service
然后卸载掉原有驱动:
sudo apt-get
给驱动run文件赋予执行权限:
sudo chmod
安装:(我之前参考另一位博主的,他没写禁用opengl,搞的我安装后出现循环登陆问题。不得已卸载重装)
sudo ./NVIDIA-Linux-x86_64-418.43.run -no-x-check -no-nouveau-check -no-opengl-files
#只有禁用opengl这样安装才不会出现循环登陆的问题
sudo service lightdm start # 重启服务

==================================================================
挂载Nvidia驱动:
modprobe nvidia
检查驱动是否安装成功:
nvidia-smi

如果出现如下提示,则说明安装成功:

三、Ubuntu16.04 CUDA安装

下载CUDA:https://developer.nvidia.com/cuda-90-download-archive
我选择【linux】->【x86_64】->【Ubuntu】->【16.04】->【runfile(local)】下载

下载后依次执行以下命令安装:cuda_9.0.176_384.81_linux.run

sudo

直接回车到底,输入​​accept​​接受条款

输入n --不装nvidia驱动。

输入y. 安装cuda toolkit

回车. 使用默认安装路径/usr/local/cuda-9.0

输入y. 安装指向/usr/local/cuda的链接

输入y. 安装Samples。

回车. 使用Samples默认安装路径/home/wsp

截图如下:(我这里设置终端背景以及字体,自带的看着实在不爽,可能是看Xshell终端看惯了)

等待安装…,安装完后会显示如下内容:

===========
= Summary =
===========

Driver: Not Selected
Toolkit: Installed in /usr/local/cuda-9.0
Samples: Installed in /home/wsp, but missing recommended libraries

Please make sure that
- PATH includes /usr/local/cuda-9.0/bin
- LD_LIBRARY_PATH includes /usr/local/cuda-9.0/lib64, or, add /usr/local/cuda-9.0/lib64 to /etc/ld.so.conf and run ldconfig as root

To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-9.0/bin

Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-9.0/doc/pdf for detailed information on setting up CUDA.

***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 9.0 functionality to work.
To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
sudo <CudaInstaller>.run -silent -driver

Logfile is /tmp/cuda_install_3937.log
3.2 环境变量配置

安装后,我们对其进行环境变量配置,依次进行如下操作:

sudo vi ~/.bashrc

# 按i进入插入模式,在末尾添加以下内容:(请注意自己的cuda版本号)
export CUDA_HOME=/usr/local/cuda-9.0
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-9.0/bin:$PATH

# 按下ESC键后输入:wq 保存退出,然后刷新:
source ~/.bashrc

# 查看版本:


3.3 编译cuda 测试


1.​​/home/username/NVIDIA_CUDA-9.0_Samples​​​ 文件夹下面,终端执行:​​make​​ (此操作需要等待一段时间0.5-1h)如果编译成功,最后会显示 Finished building CUDA samples


2.​​/home/username/NVIDIA_CUDA-9.0_Samples/bin/x86_64/linux/release​​​文件夹下面,执行:​​./deviceQuery​​ 结果如下图所示(截图如下):其中 Result = PASS 代表CUDA安装且配置成功,若 Result = FAIL:配置失败。

3.检查一下系统和CUDA-Capable device的连接情况,执行:​​./bandwidthTest​

Dell G3 搭建深度学习环境(Ubuntu16.04)_ubuntu_04

3.4 cudnn安装

下载地址:https://developer.nvidia.com/rdp/cudnn-archive
注册登陆下载,下载文件放置在home下。解压文件(提取文件)至当前目录下,得到cuda文件
将cuda下的两个文件夹复制到相应/usr/local/cuda/下:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

cd /usr/local/cuda/lib64
sudo chmod +r libcudnn.so. # 按tab键查看已有的.so版本
sudo rm -rf libcudnn.so libcudnn.so.7
sudo ln -s libcudnn.so.7.05 libcudnn.so.7
sudo ln -s libcudnn.so.7 libcudnn.so
sudo

动态链接库设置:

sudo vi /etc/ld.so.conf.d/cuda.conf  #创建文件
# 按i进入插入模式,添加以下内容:
/usr/local/cuda/lib64

#按下ESC键后输入:wq 保存退出之后使其立即生效:
sudo ldconfig
sudo ldconfig -v # 查看一下是否链接成功


四、搭建 Anaconda深度学习虚拟环境4.1 下载并安装Anaconda

清华镜像站下载地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
官网下载地址https://www.anaconda.com/

安装:在下载文件的目录打开终端,执行如下命令

bash

按回车键继续安装;

Dell G3 搭建深度学习环境(Ubuntu16.04)_linux_05


一直 按回车键 阅读注册信息,阅读完注册信息后,输入“yes”回车继续;

再次 按回车键 确认安装位置;

输入“yes”选择添加环境变量;

4.2 搭建虚拟环境

这一步截图省略了,关于详情请查看:https://blog.csdn.net/wsp_1138886114/article/details/80438993

创建虚拟环境:​​conda create -n PyTorch_GPU python=3.7​​​ 安装PyTorch运行环境: 进入​​官网​​选择相应的版本

source activate PyTorch_GPU  # 激活虚拟环境
conda install pytorch torchvision cudatoolkit=9.0 -c pytorch

# 若使用清华源使用以下命令:
conda install pytorch torchvision cudatoolkit=9.0
4.3 安装pycharm

官网下载:http://www.jetbrains.com/

解压(Linux解压即安装)解压到本地

运行:(我下载的是社区版,直接用,若你下载的是个人版需要激活,自行百度)

至此,完毕。以上所用软件我上传到百度云,如需要请留言!

连接到本地ubuntu虚拟机方法:https://www.cnblogs.com/zevfang/p/6596008.html


上一篇: 租用美国服务器:潜在的风险与应对策略。 下一篇: MongoDB 5.0 扩展开源文档数据库操作