視頻目標檢測


TCNN 

  • 靜態圖像中目標檢測(rcnn,fast rcnn, faster rcnn, yolo, ssd 等)
  • 上下文信息
    • 使用圖像檢測算法將視頻幀當做獨立的圖像來處理並沒有充分利用整個視頻的上下文信息。雖然說視頻中可能出現任意類別的目標,但對於單個視頻片段,只會出現比較少的幾個類別,而且這幾個類別之間有共現關系(出現船只的視頻段中可能會有鯨魚,但基本不可能出現斑馬)。所以,可以借助整個視頻段上的檢測結果進行統計分析:對所有檢測窗口按得分排序,選出得分較高的類別,剩余那些得分較低的類別很可能是誤檢,需對其得分進行壓制(如圖2)。經過MCS處理后的檢測結果中正確的類別靠前,錯誤的類別靠后,從而提升目標檢測的精度。
  • 運動傳播:將當前幀中的location和置信度信息傳遞給相鄰幀,(光流向量)
    • 單幀檢測結果存在很多漏檢目標,而相鄰幀圖像檢測結果中可能包含這些漏檢目標。所以我們可以借助光流信息將當前幀的檢測結果前向后向傳播,經過MGP處理可以提高目標的召回率。如圖1所示將T時刻的檢測窗口分別向前向后傳播,可以很好地填補T-1和T+1時刻的漏檢目標。
  • 基於Tracking 重新計算得分   tublet 
      • 使用圖像目標檢測算法獲取較好的檢測結果;
      • 從中選取檢測得分最高的目標作為跟蹤的起始錨點;
      • 基於選取的錨點向前向后在整個視頻片段上進行跟蹤,生成跟蹤軌跡;
      • 從剩余目標中選擇得分最高的進行跟蹤,需要注意的是如果此窗口在之前的跟蹤軌跡中出現過,那么直接跳過,選擇下一個目標進行跟蹤;
      • 算法迭代執行,可以使用得分閾值作為終止條件。

      得到的跟蹤軌跡既可以用來提高目標召回率,也可以作為長序列上下文信息對結果進行修正。

結合光流,實現特征圖的幀間傳播和復用。

Deep Feature Flow

  • 在關鍵幀進行特征圖提取,比較耗時。所以間隔進行,非關鍵幀通過傳播得到。
  •  

F 為兩幀得到的光流信息,光流計算較慢,所以在(deep learning for video saliency detection)中直接將兩幀圖像送入網絡學習時域信息,而不是計算光流信息。

 

Flow-Guided Feature Aggregation for Video Object Detection

  • 光流網絡(flownet)預測相鄰幀和該幀之間的motions

 

t 幀得到的光流特征不明顯,而t+10, t-10 的明顯,用motion-guided spatial warping預測幀之間的motion,將這些特征融合。將融合后的feature map fed to detection network得到最后的檢測結果

 

tracking---TLD

tracking learning detection:TLD是對視頻中未知物體長時間跟蹤的算法。

TLD算法主要由三個模塊構成:追蹤器(tracker),檢測器(detector)和機器學習(learning)

常用的方法有兩種,一是使用追蹤器根據物體在上一幀的位置預測它在下一幀的位置,但這樣會積累誤差,而且一旦物體在圖像中消失,追蹤器就會永久失效,即使物體再出現也無法完成追蹤;另一種方法是使用檢測器,對每一幀單獨處理檢測物體的位置,但這又需要提前對檢測器離線訓練,只能用來追蹤事先已知的物體。

        追蹤器的作用是跟蹤連續幀間的運動,當物體始終可見時跟蹤器才會有效。追蹤器根據物體在前一幀已知的位置估計在當前幀的位置,這樣就會產生一條物體運動的軌跡,從這條軌跡可以為學習模塊產生正樣本(Tracking->Learning)。
        檢測器的作用是估計追蹤器的誤差,如果誤差很大就改正追蹤器的結果。檢測器對每一幀圖像都做全面的掃描,找到與目標物體相似的所有外觀的位置,從檢測產生的結果中產生正樣本和負樣本,交給學習模塊(Detection->Learning)。算法從所有正樣本中選出一個最可信的位置作為這一幀TLD的輸出結果,然后用這個結果更新追蹤器的起始位置(Detection->Tracking)。
        學習模塊根據追蹤器和檢測器產生的正負樣本,迭代訓練分類器,改善檢測器的精度(Learning->Detection)。

 

光流法:

梯度下降的優化方法,空間運動物體在觀察成像平面上的像素運動的瞬時速度。是利用圖像序列中像素在時間域上的變化以及相鄰幀之間的相關性來找到上一幀跟當前幀之間存在的對應關系,從而計算出相鄰幀之間物體的運動信息的一種方法。

其計算方法可以分為三類:

(1)基於區域或者基於特征的匹配方法;

(2)基於頻域的方法;

(3)基於梯度的方法;

光流是空間運動物體在觀測成像平面上的像素運動的“瞬時速度”。光流的研究是利用圖像序列中的像素強度數據的時域變化和相關性來確定各自像素位置的“運動”。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM