在Ubuntu20.04上安装MindSpore1.9.0(GPU)

发布于:2022-11-09 ⋅ 阅读:(7) ⋅ 点赞:(0) ⋅ 评论:(0)

在Ubuntu20.04上安装MindSpore1.9.0(GPU)

在之前的2070上跑到后面显存不够了,导师调了一台组里的3090,接下来要在这上面安装环境

环境和之前在Ubuntu20.04+2070的差不多,这是装2070时写的:在Ubuntu20.04上安装mindspore1.8.1(GPU)

这里重新记录一下安装方法和碰到的坑

环境配置

安装对应版本CUDA+cudnn库

现在的mindspore比较推荐使用CUDA11.1版本,在nvidia官网的下载对应版本的cuda版本即可,我在组里的3090上面之前配置好的cuda上装mindspore最后会无法通过安装验证,抛出”总线错误,核心已转储“,可能是因为师兄师姐用的其他方法安装,这个难以被检查到的问题卡了我4天,最后在mindspore官方交流群的大佬的帮助下解决,感谢wqx。

cke_52363.png

CUDA安装流程参考

cuda11.1 + cuDNN v8.0.4 for CUDA 11.1 配置流程这篇写的很干练,值得参考

验证cuda安装成功:nvcc -V

验证cudnn安装成功:cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

在Ubuntu上安装多版本CUDA ubuntu中可以多版本cuda共存

CUDA安装过程中可能遇到的问题

下载遇到段错误,有文章说是因为栈空间不足

解决:

wget大文件断点重下:wget -c download_url 可以在断线之后继续下载

ubuntu wget下载过程出现“段错误,核心已转储”解决方法

如果是第二次安装的话做完软链接与路径的部分后记得重开Terminal,不然nvcc会还是会显示旧版本的CUDA

cuda安装部分reference:

在Ubuntu上安装多版本CUDA

测试cudnn是否安装成功(针对没反应的问题)

cuda11.1 + cuDNN v8.0.4 for CUDA 11.1 配置流程

Ubuntu下cuda安装出现段错误以及nvcc无法找到最新安装的cuda解决方法

ubuntu wget下载过程出现“段错误,核心已转储”解决方法

在Ubuntu20.04上安装mindspore1.8.1(GPU)

然后用Anaconda开一个新的虚拟环境

conda create -n mindspore1.9 python=3.9

-n 等价于 - name ,后面是创建的环境名

python版本建议3.9

安装MindSpore

安装

官网找到对应的下载命令下载

conda命令我用会卡住(即使是换了北外源)

pip命令可以流畅下载

在这里插入图片描述

验证安装

在conda中激活环境:conda activate mindspore1.9

验证安装:

python -c “import mindspore;mindspore.run_check()”

返回版本号以及成功提示!

在这里插入图片描述

报错记录:

验证不通过:

在这里插入图片描述

抛出总线错误,后来发现原因是之前师兄师姐装的服务器cuda环境可能不是官网上给出的cuda11.1的包,可能是装pytorch的时候直接命令安装,有些东西不一样引发的问题,重新安装cuda11.1后解决

最后可以顺便安装一下mindvision库

进入环境:conda activate mindspore1.9

git clong https://gitee.com/mindspore/vision.git

然后进入vision文件夹: cd vision

执行 python setup.py install 安装库

(我是在pycharm中新建了一个项目后在pycharm的Terminal中运行的,直接在conda环境中运行应该也可以)

然后就安装成功了,导入库不会出现红标
在这里插入图片描述
安装mindvision的教程链接:https://www.bilibili.com/video/BV1CS4y1z72r?p=2&vd_source=1422dc9d01b5aaaaa4457804c50b68ae