在Ubuntu20.04上安装MindSpore1.9.0(GPU)
在之前的2070上跑到后面显存不够了,导师调了一台组里的3090,接下来要在这上面安装环境
环境和之前在Ubuntu20.04+2070的差不多,这是装2070时写的:在Ubuntu20.04上安装mindspore1.8.1(GPU)
这里重新记录一下安装方法和碰到的坑
环境配置
安装对应版本CUDA+cudnn库
现在的mindspore比较推荐使用CUDA11.1版本,在nvidia官网的下载对应版本的cuda版本即可,我在组里的3090上面之前配置好的cuda上装mindspore最后会无法通过安装验证,抛出”总线错误,核心已转储“,可能是因为师兄师姐用的其他方法安装,这个难以被检查到的问题卡了我4天,最后在mindspore官方交流群的大佬的帮助下解决,感谢wqx。
CUDA安装流程参考
cuda11.1 + cuDNN v8.0.4 for CUDA 11.1 配置流程这篇写的很干练,值得参考
验证cuda安装成功:nvcc -V
验证cudnn安装成功:cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
在Ubuntu上安装多版本CUDA ubuntu中可以多版本cuda共存
CUDA安装过程中可能遇到的问题
下载遇到段错误,有文章说是因为栈空间不足。
解决:
wget大文件断点重下:wget -c download_url
可以在断线之后继续下载
ubuntu wget下载过程出现“段错误,核心已转储”解决方法
如果是第二次安装的话做完软链接与路径的部分后记得重开Terminal,不然nvcc会还是会显示旧版本的CUDA
cuda安装部分reference:
cuda11.1 + cuDNN v8.0.4 for CUDA 11.1 配置流程
Ubuntu下cuda安装出现段错误以及nvcc无法找到最新安装的cuda解决方法
ubuntu wget下载过程出现“段错误,核心已转储”解决方法
在Ubuntu20.04上安装mindspore1.8.1(GPU)
然后用Anaconda开一个新的虚拟环境
conda create -n mindspore1.9 python=3.9
-n 等价于 - name ,后面是创建的环境名
python版本建议3.9
安装MindSpore
安装
在官网找到对应的下载命令下载
conda命令我用会卡住(即使是换了北外源)
pip命令可以流畅下载
验证安装
在conda中激活环境:conda activate mindspore1.9
验证安装:
python -c “import mindspore;mindspore.run_check()”
返回版本号以及成功提示!
报错记录:
验证不通过:
抛出总线错误,后来发现原因是之前师兄师姐装的服务器cuda环境可能不是官网上给出的cuda11.1的包,可能是装pytorch的时候直接命令安装,有些东西不一样引发的问题,重新安装cuda11.1后解决
最后可以顺便安装一下mindvision库
进入环境:conda activate mindspore1.9
git clong https://gitee.com/mindspore/vision.git
然后进入vision文件夹: cd vision
执行 python setup.py install 安装库
(我是在pycharm中新建了一个项目后在pycharm的Terminal中运行的,直接在conda环境中运行应该也可以)
然后就安装成功了,导入库不会出现红标
安装mindvision的教程链接:https://www.bilibili.com/video/BV1CS4y1z72r?p=2&vd_source=1422dc9d01b5aaaaa4457804c50b68ae