YOLOv3-darknet 內容解析


Yolov3-darknet 內容解析

YOLOv3是到目前為止,速度和精度最均衡的目標檢測網絡。通過多種先進方法的融合,將YOLO系列的短板(速度很快,不擅長檢測小物體等)全部補齊。達到了令人驚艷的效果和拔群的速度。

多標簽分類預測

在YOLO9000[14]之后,我們的系統使用維度聚類(dimension clusters )作為anchor boxes來預測邊界框,網絡為每個邊界框預測4個坐標。

在YOLOv3[15]中使用邏輯回歸預測每個邊界框(bounding box)的對象分數。 如果先前的邊界框比之前的任何其他邊界框重疊ground truth對象,則該值應該為1。如果以前的邊界框不是最好的,但是確實將ground truth對象重疊了一定的閾值以上,我們會忽略這個預測,按照進行。我們使用閾值0.5。與YOLOv2不同,我們的系統只為每個ground truth對象分配一個邊界框。如果先前的邊界框未分配給grounding box對象,則不會對坐標或類別預測造成損失。

在YOLOv3中,每個框使用多標簽分類來預測邊界框可能包含的類。該算法不使用softmax,因為它對於高性能沒有必要,因此YOLOv3使用獨立的邏輯分類器。在訓練過程中,我們使用二元交叉熵損失來進行類別預測。對於重疊的標簽,多標簽方法可以更好地模擬數據。

跨尺度預測

YOLOv3采用多個尺度融合的方式做預測。原來的YOLO v2有一個層叫:passthrough layer,假設最后提取的feature map的size是13*13,那么這個層的作用就是將前面一層的26*26的feature map和本層的13*13的feature map進行連接,有點像ResNet。這樣的操作也是為了加強YOLO算法對小目標檢測的精確度。這個思想在YOLO v3中得到了進一步加強,在YOLO v3中采用類似FPN的上采樣(upsample)和融合做法(最后融合了3個scale,其他兩個scale的大小分別是26*26和52*52),在多個scale的feature map上做檢測,對於小目標的檢測效果提升還是比較明顯的。雖然在YOLO v3中每個網格預測3個邊界框,看起來比YOLO v2中每個grid cell預測5個邊界框要少,但因為YOLO v3采用了多個尺度的特征融合,所以邊界框的數量要比之前多很多。

網絡結構改變

YOLO v3使用新的網絡來實現特征提取。在Darknet-19中添加殘差網絡的混合方式,使用連續的3×3和1×1卷積層,但現在也有一些shortcut連接,YOLO v3將其擴充為53層並稱之為Darknet-53。

reference

https://zhuanlan.zhihu.com/p/37668951


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM