多目標跟蹤(MOT)論文隨筆-SIMPLE ONLINE AND REALTIME TRACKING WITH A DEEP ASSOCIATION METRIC (Deep SORT)

本文轉載自查看原文 2018-03-25 11:17 4440 多目標跟蹤(MOT)/ MOT/ 深度學習/ 多目標跟蹤

網上已有很多關於MOT的文章，此系列僅為個人閱讀隨筆，便於初學者的共同成長。若希望詳細了解，建議閱讀原文。

本文是tracking by detection 方法進行多目標跟蹤的文章，在SORT的基礎上進行了改進(SORT見前一篇隨筆)。
論文地址：https://arxiv.org/pdf/1703.07402.pdf
代碼地址：https://github.com/nwojke/deep_sort

文章概述

本方法最大的特點是加入了appearance信息來提高之前SORT的性能，用cosine 距離來度量 tracks 和 detection 的相似度以減少 SORT算法中ID switch的次數（減少了45%），並使用Kalman預測和實際detection間的平方馬氏距離來過濾可能性小的匹配。

文章觀點

文章方法

采用遞歸卡爾曼濾波和逐幀數據關聯的傳統單一假設跟蹤方法。

1. 狀態估計

2. 指派問題

使用combined距離來作為cost matrix進行度量各個track和detection之間的距離，這里文中只使用cosine距離進行度量（即將lambda設置為0），使用馬氏距離排除不可能的情況，既基於由卡爾曼濾波器推斷的可能的物體位置忽略不可行的分配。

3. 級聯匹配

物體被遮擋一段時間后，卡爾曼濾波預測的不確定性大大增加並且狀態空間上可觀察性變得很低，並且馬氏距離更傾向於不確定性更大的track，這是由於減少了detection的標准差距預計的軌跡的距離。因此這里引入級聯匹配，優先匹配detection與最近出現的track；
Matching Cascade算法見下，在最后結束算法時使用SORT中的IOU距離來解決局部遮擋的問題，通過計算unmatched tracks（只有前一幀是unmatched的）和 unmatched detection的IOU distance，詳細見最后的代碼流程圖。

4. Appearance 描述

通過在大規模re-id數據集上pre-trained深度網絡來提取128維的appearance特征，用L2正則化將特征投影到單位超球面上來與余弦距離進行匹配，網絡結構見下（需要注意的是此處的detection用的是POI中的detection坐標，文中的CNN網絡用於提取bbox中的特征）。

文章結果

相對於SORT，本文主要解決的是ID Switch過大的問題，從結果中可以看出ID Switch比之前下降了45%，並達到了state-of-the-art；
MOTA，MOTP，MT，ML，FN指標相對於之前都有提升，並且速度下降不大，很實用；
FM的上升主要是因為聯合的matrix中過於強調appearance，導致在有遮擋或者丟失時detection的錯誤導致；
FP的升高很多，文章中提出這主要是由於靜態場景中detection的錯誤以及過長的允許丟失的track age所導致的（相對於SORT只用相鄰幀進行匹配來說，Deep SORT允許高達30幀的丟失，而Kalman的等速運動模型沒有改變，這主要造成了FP的升高）。

代碼流程圖

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 多目標跟蹤方法：deep-sort 多目標跟蹤MOT綜述 Deep Sort 多目標跟蹤算法總結-by Wilson Deep SORT多目標跟蹤算法代碼解析多目標跟蹤(MOT)評測標准多目標跟蹤算法——SORT 檢索(retrieval && search )-單目標-多目標跟蹤-MTMC Tracking和 ReID 論文盤點：基於圖卷積GNN的多目標跟蹤算法解析多目標跟蹤：CVPR2019論文閱讀多目標跟蹤綜述(二)