關於 deep-high-resolution-net.pytorch 遇到一些的坑


一、前言

  1. 前段時間在網上看到一個博主發布了一個基於視覺ai的自動輔助瞄准的程序,上上周在微信刷到了這篇文章
  2. 本着試一試的態度,去翻閱了相關的文獻,然后開始搞 

  3. 順嘴一提,作者說 該代碼是在Ubuntu 16.04 上使用 python 3.6 開發的。需要 NVIDIA GPU。該代碼是使用 4 個 NVIDIA P100 GPU 卡開發和測試的。其他平台或 GPU 卡未經過全面測試。

二、環境

  • 操作系統:Windows 10
  • 顯卡:1650(都是坑)
  • 模型:High-Resoultion Net(HRNet)

三、安裝依賴相關的坑

  1. HRNet安裝:

    git clone https://github.com/leoxiaobin/deep-high-resolution-net.pytorch.git
    

      

  2. 接着就是安裝依賴,作者給的是:
    pip install -r requirements.txt

    文本內容如下: 

    EasyDict==1.7
    opencv-python==3.4.1.15
    shapely==1.6.4
    Cython
    scipy
    pandas
    pyyaml
    json_tricks
    scikit-image
    yacs>=0.1.5
    tensorboardX==1.6

  3.  安裝shapely報錯:解決方法 https://blog.csdn.net/weixin_44601149/article/details/103375247      這里有個小問題就是,根據這位博主所提供的地址,里面並沒有py36對應的 這里我嘗試直接 pip 1.7.1這個版本,后面沒遇到版本沖突問題(沒有從這里下,是直接pip)

     

     

  4. No module named ‘pycocotools‘ 解決方法:https://blog.csdn.net/weixin_42410915/article/details/109368497    這個需要按他說的下載再安裝
  5.  

     上面並不是沒有添加環境,而是我壓根就沒安裝!  附上鏈接:https://www.jianshu.com/p/9bdeb033e765  我只需要cuda 沒管后面所說的cudnn,無需去配置cuda環境變量(應該是默認就配搭好的)

  6. 接着就是經典錯誤了 

     大致的意思就是我要安裝的庫,需要本地c++進行編譯,現在缺少這個依賴項,我這里為了避免之后遇到這類問題,直接去官網下載相關的依賴

     然后重啟,再接着安裝,發現問題就解決了!

四、制作庫遇到的一些坑(Make libs keng:)

  1. 作者是在烏邦圖跑的代碼,所以它的這部分代碼不支持windows下,但torch支持windows,於是乎就有了

     

     

  2. 這個分支多了lib下新增了一個build_windows.bat nms下對其原有的三個文件進行了修改,我照着改了下,完全沒得問題!

     

     

五、對COCO val2017 數據集進行測試遇到的坑

  1.   AssertionError:Invalid device id  

     

     作者默認是四個gpu,咱就一個,所以做如下更改:

     

     

     

  2. BrokenPipError:[Errno 32]  Broken pipe   

 

       這里作者的配置是四個gpu,我就一個,所以直接刪掉乘號部分

   3.UserWarning:此DataLoader將創建24個工作進......這個問題其實是還是那個問題,他是4個gpu,我一個,所以我需要除4,將worker參數改為6即可

 

     

 

 

 

然后  這部分就跑通了

 

六、在COCO train2017 數據集上進行訓練所遇到的坑

  1. AttributeError:module 'torch.onnx' has no attribute 'set_training'

     

     解決辦法

     

     

  2. 然后就是和剛才測試一樣的問題,一一修改。
  3. RuntimeError: CUDA out of memory .Trued.to.......這個問題

     

     有人說是讓減小batch_size  但會不會影響模型性能我不知道,我將其改為了4(6我依然報錯)

     

     

 然后順利運行到此刻,我發現我忽略了一個問題,我一個gpu需要多少時間才能跑完???????於是乎我后知后覺的去查了下

 

 

 

 

 

 

 

 好耶!!!!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM