跑通SOLOV1-V2實例分割代碼，並訓練自己的數據集

本文轉載自查看原文 2021-05-25 12:04 1773 圖像分割

SOLOv 2：實例分割（動態、更快、更強）

論文鏈接：https://arxiv.org/abs/1912.04488

論文解讀博文

https://blog.csdn.net/sanshibayuan/article/details/103895058

就目前來講，很多實例分割算法存在的問題弊端主要是：

速度太慢了，比如Maskrcnn，雖然聲名遠揚，但是要把它部署到realtime，還是很困難的；
精度不夠，比如Yolact，即便是Yolact++，其精度其實也只能說差強人意，連MaskRCNN都比不上的實力分割，速度再快，也會限制它的使用場景；
BlendMask，CenterMask這類的算法，都差不多，基於FCOS構建，本質上沒啥區別，還是和MaskRCNN整體流程差不多，只不過檢測器變了而已，對於部署來說依舊很麻煩。

對於許多二階段的實例分割算法，轉換到另一個推理平台很麻煩，主要是這里面存在RPN的一些操作，即便是類似於CenterMask這樣的模型，也需要先獲取box，然后經過ROIAlign和ROIPool來得到需要的mask，這個過程不僅計算繁瑣，而且很難導出到我們想要的模型格式，比如ONNX就不支持這里面的很多op。SOLOV2的性能似乎比maskrcnn差不多，推理速度只要一半，並且速度和精確度都超過了BlendMask。

通過改進，SOLOv2的AP性能比SOLOv1高出1.9%，而速度提高了33%。Res-50-FPN SOLOv2在具有挑戰性的MS-COCO數據集上以18 FPS的速度實現38.8%的掩模AP，在單個V100 GPU卡上進行評估。一個輕量級版本的SOLOv2以31.3FPS的速度執行，產生37.1%的掩模AP。有趣的是，雖然本文的方法徹底消除了bounding box的概念，但是本文的bounding box的副產品，即直接將預測的掩模轉換為bounding box，產生42.4%的AP用於bounding box對象檢測，它甚至超過了許多最先進、高度工程化的目標檢測方法。