一、前言
- 前段时间在网上看到一个博主发布了一个基于视觉ai的自动辅助瞄准的程序,上上周在微信刷到了这篇文章
-
本着试一试的态度,去翻阅了相关的文献,然后开始搞
- 顺嘴一提,作者说 该代码是在Ubuntu 16.04 上使用 python 3.6 开发的。需要 NVIDIA GPU。该代码是使用 4 个 NVIDIA P100 GPU 卡开发和测试的。其他平台或 GPU 卡未经过全面测试。
二、环境
- 操作系统:Windows 10
- 显卡:1650(都是坑)
- 模型:High-Resoultion Net(HRNet)
三、安装依赖相关的坑
-
HRNet安装:
git clone https://github.com/leoxiaobin/deep-high-resolution-net.pytorch.git
- 接着就是安装依赖,作者给的是:
pip install -r requirements.txt
文本内容如下:
EasyDict==1.7
opencv-python==3.4.1.15
shapely==1.6.4
Cython
scipy
pandas
pyyaml
json_tricks
scikit-image
yacs>=0.1.5
tensorboardX==1.6 - 安装shapely报错:解决方法 https://blog.csdn.net/weixin_44601149/article/details/103375247 这里有个小问题就是,根据这位博主所提供的地址,里面并没有py36对应的
这里我尝试直接 pip 1.7.1这个版本,后面没遇到版本冲突问题(没有从这里下,是直接pip)
- No module named ‘pycocotools‘ 解决方法:https://blog.csdn.net/weixin_42410915/article/details/109368497 这个需要按他说的下载再安装
-
上面并不是没有添加环境,而是我压根就没安装! 附上链接:https://www.jianshu.com/p/9bdeb033e765 我只需要cuda 没管后面所说的cudnn,无需去配置cuda环境变量(应该是默认就配搭好的)
- 接着就是经典错误了
大致的意思就是我要安装的库,需要本地c++进行编译,现在缺少这个依赖项,我这里为了避免之后遇到这类问题,直接去官网下载相关的依赖
然后重启,再接着安装,发现问题就解决了!
四、制作库遇到的一些坑(Make libs keng:)
- 作者是在乌邦图跑的代码,所以它的这部分代码不支持windows下,但torch支持windows,于是乎就有了
- 这个分支多了lib下新增了一个build_windows.bat nms下对其原有的三个文件进行了修改,我照着改了下,完全没得问题!
五、对COCO val2017 数据集进行测试遇到的坑
- AssertionError:Invalid device id
作者默认是四个gpu,咱就一个,所以做如下更改:
- BrokenPipError:[Errno 32] Broken pipe
这里作者的配置是四个gpu,我就一个,所以直接删掉乘号部分
3.UserWarning:此DataLoader将创建24个工作进......这个问题其实是还是那个问题,他是4个gpu,我一个,所以我需要除4,将worker参数改为6即可
然后 这部分就跑通了
六、在COCO train2017 数据集上进行训练所遇到的坑
- AttributeError:module 'torch.onnx' has no attribute 'set_training'
解决办法
- 然后就是和刚才测试一样的问题,一一修改。
- RuntimeError: CUDA out of memory .Trued.to.......这个问题
有人说是让减小batch_size 但会不会影响模型性能我不知道,我将其改为了4(6我依然报错)
然后顺利运行到此刻,我发现我忽略了一个问题,我一个gpu需要多少时间才能跑完???????于是乎我后知后觉的去查了下
好耶!!!!