0 引言
兜兜轉轉還是搞起了深度學習,圖像處理。近來做了很多數據標注的工作,就像曾經面試的時候一個負責人說的那樣,數據常常決定了學習結果的優劣,模型改進優化啥的,我們做工程的用的少。因此,標注了很多數據之后,有一些心得和感悟,還有一些小技巧和實驗失敗的地方,記錄一下,希望以后不要再犯,因為我記憶力太差太差了。同時,希望與大家共勉。
1 數據采集部分
1)在數據采集的時候,一定要注意采集設備的穩定性,手持是非常不穩的。我們試過很多很多次,即使我們固定了手腕,也不能夠避免人體本身的抖動。包括剛開始視角的調整。使用固定支架能夠很好避免這些問題。
2)我們做的是紅外采集,視頻和圖片同時寫入本地時並不會影響整個采集過程的速度,再384*288大小圖片背景下,我們寫入視頻和圖片使用當前時間時分秒作為名稱,結果顯示,每100毫秒30幀頻下,有兩張圖像采集偏差3毫秒。幾乎無延遲。
3)采集對象一定要確定提前確定好,數據樣本的偏差性,會導致目標檢測的對象存在不同的識別精度。在采集的時候一定考慮特定對象的采集。我們采集的是運動過程中的車輛,前期由於為了數據量大,因此就一直采集,一直采集,沒有考慮特定目標,比如摩托車數量很少,因此后期做了很多特定的采集工作,專門采集摩托車。
2. 數據標注部分
1)在數據標注部分,這是我們最需要注意的。遮擋對象是否要標注;
2)模糊對象是否要標注;
3)只有一半大小的對象是否要標注;
4)大目標包含小目標,大目標是否要標注;
5)標注時標簽的確定;一定要提前確定好,不然會做很多重復功。
6)在自動標注部分,我們做了幾個工作,首先使用YOLO V5做多目標檢測的自動標注。(需要我們訓練一部分之后,再用新weights去檢測圖像。這里出現最多的一個問題就是重復框問題,很奇怪的是我們已經在YOLO中使用了一定的IoU,然后使用NMS去掉了多余Anchors, 為什么同一個對象仍然有多個框,調節threshold也沒有太多的用處,當然會有一定的效果,置信度變了之后框多框少異常。)
7)在單目標跟蹤上面,我們使用了SiamRPN++做我們單目標跟蹤的自動標注工具。
高鐵上,寫不動了,累了。祝大家晚安。