faster-rcnn在編譯時遇到的一些問題

本文轉載自查看原文 2017-04-06 11:56 2899 faster-rcnn/ 深度學習

1.在安裝faster-rcnn事如果報這種錯誤

In file included from ./include/caffe/util/device_alternate.hpp:40:0,
                 from ./include/caffe/common.hpp:19,
                 from ./include/caffe/blob.hpp:8,
                 from ./include/caffe/net.hpp:10,
                 from ./include/caffe/solver.hpp:7,
                 from ./include/caffe/sgd_solvers.hpp:7,
                 from src/caffe/solvers/adam_solver.cpp:3:
./include/caffe/util/cudnn.hpp: In function ‘const char* cudnnGetErrorString(cudnnStatus_t)’:
./include/caffe/util/cudnn.hpp:21:10: warning: enumeration value ‘CUDNN_STATUS_RUNTIME_PREREQUISITE_MISSING’ not handled in switch [-Wswitch]
   switch (status) {
          ^
./include/caffe/util/cudnn.hpp: In function ‘void caffe::cudnn::setConvolutionDesc(cudnnConvolutionStruct**, cudnnTensorDescriptor_t, cudnnFilterDescriptor_t, int, int, int, int)’:
./include/caffe/util/cudnn.hpp:108:70: error: too few arguments to function ‘cudnnStatus_t cudnnSetConvolution2dDescriptor(cudnnConvolutionDescriptor_t, int, int, int, int, int, int, cudnnConvolutionMode_t, cudnnDataType_t)’
       pad_h, pad_w, stride_h, stride_w, 1, 1, CUDNN_CROSS_CORRELATION));
                                                                      ^

處理方案:

這種問題出現的原因是在rbg開源這套物體檢查方案時是依據的當時最新的cundnn版本，而這么多年過去，cudnn已經發布了好幾個版本，所以要處理這個問題，只需要將caffe框架下的所有cudnn相關的文件替換車成當前caffe最新的即可.

rbg的faster-rcnn模型代碼地址： https://github.com/rbgirshick/py-faster-rcnn

cafe框架的代碼地址： https://github.com/BVLC/caffe

進入faster-rcnn目錄下py-caffe的src/caffe/util/cudnn.cpp 以及src/caffe/layers/cudnn*中的所有文件.還有include/util/cudnn.hpp 和include/layers/cudnn*.hpp中的文件全部替換成caffe中對應的文件.然后編譯即可.

python setup.py build_ext --inplace
Traceback (most recent call last):
  File "setup.py", line 58, in <module>
    CUDA = locate_cuda()
  File "setup.py", line 55, in locate_cuda
    raise EnvironmentError('The CUDA %s path could not be located in %s' % (k, v))
EnvironmentError: The CUDA lib64 path could not be located in /usr/lib64
Makefile:2: recipe for target 'all' failed
make: *** [all] Error 1

這種問題是由於只需要將53行的第二個lib64換成lib即可.

3.安裝opencv

sudo apt-get install python-opencv

4.

 File "/home/gxjun/Qunar/py-faster-rcnn/tools/train_faster_rcnn_alt_opt.py", line 67, in get_roidb
    roidb = get_training_roidb(imdb)
  File "/home/gxjun/Qunar/py-faster-rcnn/tools/../lib/fast_rcnn/train.py", line 118, in get_training_roidb
    imdb.append_flipped_images()
  File "/home/gxjun/Qunar/py-faster-rcnn/tools/../lib/datasets/imdb.py", line 111, in append_flipped_images
    assert (boxes[:, 2] >= boxes[:, 0]).all()

這種問題，一般都是清楚緩存，去cache下刪除所有文件就可以了

5. 出現問題：訓練faster rcnn時出現如下報錯：

File "/py-faster-rcnn/tools/../lib/datasets/imdb.py", line 108, in append_flipped_images
    assert (boxes[:, 2] >= boxes[:, 0]).all()
AssertionError

2、問題分析：

檢查自己數據發現，左上角坐標（x,y）可能為0，或標定區域溢出圖片
其實還存在一種問題，就是圖片出現旋轉問題.

snapshot_prefix: "vgg16_rpn"
average_loss: 100
I0421 11:53:05.251756 24051 solver.cpp:81] Creating training net from train_net file: models/pascal_voc/VGG16/faster_rcnn_alt_opt/stage1_rpn_train.pt
F0421 11:53:05.251797 24051 io.cpp:36] Check failed: fd != -1 (-1 vs. -1) File not found: models/pascal_voc/VGG16/faster_rcnn_alt_opt/stage1_rpn_train.pt
*** Check failure stack trace: ***

將sovler.txt中的路徑設置成絕對路徑

 1 Traceback (most recent call last):
 2   File "/usr/lib/python2.7/multiprocessing/process.py", line 258, in _bootstrap
 3     self.run()
 4   File "/usr/lib/python2.7/multiprocessing/process.py", line 114, in run
 5     self._target(*self._args, **self._kwargs)
 6   File "/media/gxjun/78289D37289CF4FA/py-faster-rcnn/tools/train_faster_rcnn_alt_opt.py", line 208, in train_fast_rcnn
 7     max_iters=max_iters)
 8   File "/media/gxjun/78289D37289CF4FA/py-faster-rcnn/tools/../lib/fast_rcnn/train.py", line 160, in train_net
 9     model_paths = sw.train_model(max_iters)
10   File "/media/gxjun/78289D37289CF4FA/py-faster-rcnn/tools/../lib/fast_rcnn/train.py", line 101, in train_model
11     self.solver.step(1)
12   File "/media/gxjun/78289D37289CF4FA/py-faster-rcnn/tools/../lib/roi_data_layer/layer.py", line 144, in forward
13     blobs = self._get_next_minibatch()
14   File "/media/gxjun/78289D37289CF4FA/py-faster-rcnn/tools/../lib/roi_data_layer/layer.py", line 63, in _get_next_minibatch
15     return get_minibatch(minibatch_db, self._num_classes)
16   File "/media/gxjun/78289D37289CF4FA/py-faster-rcnn/tools/../lib/roi_data_layer/minibatch.py", line 55, in get_minibatch
17     num_classes)
18   File "/media/gxjun/78289D37289CF4FA/py-faster-rcnn/tools/../lib/roi_data_layer/minibatch.py", line 125, in _sample_rois
19     roidb['bbox_targets'][keep_inds, :], num_classes)
20   File "/media/gxjun/78289D37289CF4FA/py-faster-rcnn/tools/../lib/roi_data_layer/minibatch.py", line 176, in _get_bbox_regression_labels
21     bbox_targets[ind, start:end] = bbox_target_data[ind, 1:]
22 ValueError: could not broadcast input array from shape (4) into shape (0)

這種問題，一般是model配置參數有問題.需要重新設置protxt中的參數.

645 net.cpp:408] rpn_cls_prob_reshape -> rpn_cls_prob_reshape
F0810 10:54:11.421221   645 reshape_layer.cpp:80] Check failed: 0 == bottom[0]->count() % explicit_count (0 vs. 58320) bottom count (408240) must be divisible by the product of the specified dimensions (87480)
*** Check failure stack trace: ***

這種問題，一般是看對應的層的參數，比如這里是rpn_cls＿prob參數有問題.

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 UWP使用.Net Native編譯時遇到的一些問題。 CentOs 編譯php 遇到的一些問題總結初用erlang 時的遇到一些問題 caffe下訓練時遇到的一些問題匯總使用MDnet時遇到的一些問題（matlab版）使用docker時遇到的一些問題 springmvc配置jackson時遇到的一些問題 Pytorch復現Faster-RCNN Faster-RCNN 訓練自己的數據 faster-rcnn原理講解