一、前言
- 前段時間在網上看到一個博主發布了一個基於視覺ai的自動輔助瞄准的程序,上上周在微信刷到了這篇文章

-
本着試一試的態度,去翻閱了相關的文獻,然后開始搞
- 順嘴一提,作者說 該代碼是在Ubuntu 16.04 上使用 python 3.6 開發的。需要 NVIDIA GPU。該代碼是使用 4 個 NVIDIA P100 GPU 卡開發和測試的。其他平台或 GPU 卡未經過全面測試。
二、環境
- 操作系統:Windows 10
- 顯卡:1650(都是坑)
- 模型:High-Resoultion Net(HRNet)
三、安裝依賴相關的坑
-
HRNet安裝:
git clone https://github.com/leoxiaobin/deep-high-resolution-net.pytorch.git
- 接着就是安裝依賴,作者給的是:
pip install -r requirements.txt
文本內容如下:
EasyDict==1.7
opencv-python==3.4.1.15
shapely==1.6.4
Cython
scipy
pandas
pyyaml
json_tricks
scikit-image
yacs>=0.1.5
tensorboardX==1.6 - 安裝shapely報錯:解決方法 https://blog.csdn.net/weixin_44601149/article/details/103375247 這里有個小問題就是,根據這位博主所提供的地址,里面並沒有py36對應的
這里我嘗試直接 pip 1.7.1這個版本,后面沒遇到版本沖突問題(沒有從這里下,是直接pip)
- No module named ‘pycocotools‘ 解決方法:https://blog.csdn.net/weixin_42410915/article/details/109368497 這個需要按他說的下載再安裝

-
上面並不是沒有添加環境,而是我壓根就沒安裝! 附上鏈接:https://www.jianshu.com/p/9bdeb033e765 我只需要cuda 沒管后面所說的cudnn,無需去配置cuda環境變量(應該是默認就配搭好的)
- 接着就是經典錯誤了
大致的意思就是我要安裝的庫,需要本地c++進行編譯,現在缺少這個依賴項,我這里為了避免之后遇到這類問題,直接去官網下載相關的依賴



然后重啟,再接着安裝,發現問題就解決了!
四、制作庫遇到的一些坑(Make libs keng:)
- 作者是在烏邦圖跑的代碼,所以它的這部分代碼不支持windows下,但torch支持windows,於是乎就有了
- 這個分支多了lib下新增了一個build_windows.bat nms下對其原有的三個文件進行了修改,我照着改了下,完全沒得問題!
五、對COCO val2017 數據集進行測試遇到的坑
- AssertionError:Invalid device id
作者默認是四個gpu,咱就一個,所以做如下更改:

- BrokenPipError:[Errno 32] Broken pipe

這里作者的配置是四個gpu,我就一個,所以直接刪掉乘號部分

3.UserWarning:此DataLoader將創建24個工作進......這個問題其實是還是那個問題,他是4個gpu,我一個,所以我需要除4,將worker參數改為6即可

然后 這部分就跑通了
六、在COCO train2017 數據集上進行訓練所遇到的坑
- AttributeError:module 'torch.onnx' has no attribute 'set_training'
解決辦法

- 然后就是和剛才測試一樣的問題,一一修改。
- RuntimeError: CUDA out of memory .Trued.to.......這個問題
有人說是讓減小batch_size 但會不會影響模型性能我不知道,我將其改為了4(6我依然報錯)

然后順利運行到此刻,我發現我忽略了一個問題,我一個gpu需要多少時間才能跑完???????於是乎我后知后覺的去查了下

好耶!!!!
