視頻目標處理涉及的目標分割、目標識別、目標檢測和目標跟蹤都是指什么?


      (1)目標分割,應該是Target Segmentation,應該是data/image segmentation的一種。

        這里假定數據是圖像,就如樓上說的,任務是把目標對應的部分分割出來。對於一般的光學圖像而言,分割像素是一個比較常見的目標,就是要提取哪一些像素是用於表述已知目標的。這種Segmentation可以是一個分類(classificatio)問題,就是把每一個pixel做labeling,提出感興趣的那一類label的像素。也可以是clustering的問題,即是不知道label,但需要滿足一些optimality,比如要cluster之間的correlation最小之類的。當然,答主也見過一些針對其他數據的目標分割,比如hyperspectral data,也需要分割哪些頻率或者通道對應的是目標。比如視頻流,那段時間對應是目標。

        下面是一個Target Segmentation的栗子:

 

      (2)目標識別,應該是Target Recognition。
        這是一個基於分類(Classification)的識別(Recognition)問題,即是在所有的給定數據中,分類出哪一些sample是目標,哪一些不是。還是拿圖片作為數據舉例,這個分類的層面往往不是pixel,給定的一些segment,或者定義的對象(Object),或者圖片本身。
       下面是一個Target Recognition的栗子:

       (3)目標檢測,應該是Target Detection。
        最早的detection system應該是搞雷達的人首先提出並且heavily study的,最簡單的任務就是從看似隨機(random)又充滿干擾(interference)和噪音(noise)的信號中,抓取到有信息的特征(information-bearing pattern)。最簡單的一個栗子,就是當你拿到一段隨機的雷達回波,可以設置一個threshold,當高於這個threshold,就認為是探測到了高速大面積飛行器之類的高回波的目標。當然,這里面的threshold該怎么設計,涉及到False Alarm和Miss Detection之間的平衡。人們往往需要尋找最佳的transform或者domain去對信號進行分析。
        下面是一個Target Detection的栗子:

      (4)目標追蹤,應該是Target Tracking。
        這個任務很重要的第一點是目標定位(Target Locating),而且這個任務設計到的數據一般具有時間序列(Temporal Data)。常見的情況是首先Target被Identify以后,算法或者系統需要在接下來時序的數據中,快速並高效地對給定目標進行再定位。任務需要區別類似目標,需要避免不要的重復計算,充分利用好時序相關性(Temporal Correlation),並且需要對一些簡單的變化Robust,必須旋轉,遮蓋,縮小放大,Motion Blur之類的線性或者非線性變化。
        下面是一個Target Detection的栗子:
 
       
 
 
本文摘錄自:https://www.zhihu.com/question/36500536
 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM