最簡單的目標跟蹤(模版匹配)


一、概述

       目標跟蹤是計算機視覺領域的一個重要分支。研究的人很多,近幾年也出現了很多很多的算法。大家看看淋漓滿目的paper就知道了。但在這里,我們也聚焦下比較簡單的算法,看看它的優勢在哪里。畢竟有時候簡單就是一種美。

       在這里我們一起來欣賞下“模板匹配”這個簡單點的跟蹤算法。它的思想很簡單,我們把要跟蹤的目標保存好,然后在每一幀來臨的時候,我們在整個圖像中尋找與這個目標最相似的,我們就相信這個就是目標了。那如何判斷相似呢?就用到了一些相關性的東西了,這個在我之前的一篇博文里面介紹過,大家可以參考下:

       模板匹配中差值的平方和(SSD)與互相關准則的關系

http://blog.csdn.net/zouxy09/article/details/8549743

       然后為了適應目標的變化,我們就需要隨時更新我們要跟蹤的目標。換句話來說,在跟蹤t幀的時候,也就是在第t幀尋找目標的時候,是與t-1幀中我們找到的目標來進行比較的。這樣目標的外觀變化就會及時的更新。這個就叫做在線跟蹤方法。當然了,這個策略會導致跟蹤漂移的問題,這就是近幾年很多跟蹤算法關注的重要問題之一了。

 

二、代碼實現

       我的代碼是基於VS2010+ OpenCV2.4.2的。代碼可以讀入視頻,也可以讀攝像頭,兩者的選擇只需要在代碼中稍微修改即可。對於視頻來說,運行會先顯示第一幀,然后我們用鼠標框選要跟蹤的目標,然后跟蹤器開始跟蹤每一幀。對攝像頭來說,就會一直采集圖像,然后我們用鼠標框選要跟蹤的目標,接着跟蹤器開始跟蹤后面的每一幀。具體代碼如下:

simpleTracker.cpp

 

[cpp]  view plaincopy
  1. // Object tracking algorithm using matchTemplate  
  2. // Author : zouxy  
  3. // Date   : 2013-10-28  
  4. // HomePage : http://blog.csdn.net/zouxy09  
  5. // Email  : zouxy09@qq.com  
  6.   
  7. #include <opencv2/opencv.hpp>  
  8.   
  9. using namespace cv;  
  10. using namespace std;  
  11.   
  12. // Global variables  
  13. Rect box;  
  14. bool drawing_box = false;  
  15. bool gotBB = false;  
  16.   
  17. // bounding box mouse callback  
  18. void mouseHandler(int event, int x, int y, int flags, void *param){  
  19.   switch( event ){  
  20.   case CV_EVENT_MOUSEMOVE:  
  21.     if (drawing_box){  
  22.         box.width = x-box.x;  
  23.         box.height = y-box.y;  
  24.     }  
  25.     break;  
  26.   case CV_EVENT_LBUTTONDOWN:  
  27.     drawing_box = true;  
  28.     box = Rect( x, y, 0, 0 );  
  29.     break;  
  30.   case CV_EVENT_LBUTTONUP:  
  31.     drawing_box = false;  
  32.     if( box.width < 0 ){  
  33.         box.x += box.width;  
  34.         box.width *= -1;  
  35.     }  
  36.     if( box.height < 0 ){  
  37.         box.y += box.height;  
  38.         box.height *= -1;  
  39.     }  
  40.     gotBB = true;  
  41.     break;  
  42.   }  
  43. }  
  44.   
  45.   
  46. // tracker: get search patches around the last tracking box,  
  47. // and find the most similar one  
  48. void tracking(Mat frame, Mat &model, Rect &trackBox)  
  49. {  
  50.     Mat gray;  
  51.     cvtColor(frame, gray, CV_RGB2GRAY);  
  52.   
  53.     Rect searchWindow;  
  54.     searchWindow.width = trackBox.width * 3;  
  55.     searchWindow.height = trackBox.height * 3;  
  56.     searchWindow.x = trackBox.x + trackBox.width * 0.5 - searchWindow.width * 0.5;  
  57.     searchWindow.y = trackBox.y + trackBox.height * 0.5 - searchWindow.height * 0.5;  
  58.     searchWindow &= Rect(0, 0, frame.cols, frame.rows);  
  59.   
  60.     Mat similarity;  
  61.     matchTemplate(gray(searchWindow), model, similarity, CV_TM_CCOEFF_NORMED);   
  62.   
  63.     double mag_r;  
  64.     Point point;  
  65.     minMaxLoc(similarity, 0, &mag_r, 0, &point);  
  66.     trackBox.x = point.x + searchWindow.x;  
  67.     trackBox.y = point.y + searchWindow.y;  
  68.     model = gray(trackBox);  
  69. }  
  70.   
  71. int main(int argc, char * argv[])  
  72. {  
  73.     VideoCapture capture;  
  74.     capture.open("david.mpg");  
  75.     bool fromfile = true;  
  76.     //Init camera  
  77.     if (!capture.isOpened())  
  78.     {  
  79.         cout << "capture device failed to open!" << endl;  
  80.         return -1;  
  81.     }  
  82.     //Register mouse callback to draw the bounding box  
  83.     cvNamedWindow("Tracker", CV_WINDOW_AUTOSIZE);  
  84.     cvSetMouseCallback("Tracker", mouseHandler, NULL );   
  85.   
  86.     Mat frame, model;  
  87.     capture >> frame;  
  88.     while(!gotBB)  
  89.     {  
  90.         if (!fromfile)  
  91.             capture >> frame;  
  92.   
  93.         imshow("Tracker", frame);  
  94.         if (cvWaitKey(20) == 'q')  
  95.             return 1;  
  96.     }  
  97.     //Remove callback  
  98.     cvSetMouseCallback("Tracker", NULL, NULL );   
  99.       
  100.     Mat gray;  
  101.     cvtColor(frame, gray, CV_RGB2GRAY);   
  102.     model = gray(box);  
  103.   
  104.     int frameCount = 0;  
  105.   
  106.     while (1)  
  107.     {  
  108.         capture >> frame;  
  109.         if (frame.empty())  
  110.             return -1;  
  111.         double t = (double)cvGetTickCount();  
  112.         frameCount++;  
  113.   
  114.         // tracking  
  115.         tracking(frame, model, box);      
  116.   
  117.         // show  
  118.         stringstream buf;  
  119.         buf << frameCount;  
  120.         string num = buf.str();  
  121.         putText(frame, num, Point(20, 20), FONT_HERSHEY_SIMPLEX, 1, Scalar(0, 0, 255), 3);  
  122.         rectangle(frame, box, Scalar(0, 0, 255), 3);  
  123.         imshow("Tracker", frame);  
  124.   
  125.   
  126.         t = (double)cvGetTickCount() - t;  
  127.         cout << "cost time: " << t / ((double)cvGetTickFrequency()*1000.) << endl;  
  128.   
  129.         if ( cvWaitKey(1) == 27 )  
  130.             break;  
  131.     }  
  132.   
  133.     return 0;  
  134. }  

 

 

三、結果

       我們對在目標跟蹤領域一個benchmark的視頻-david來測試下代碼的效果。如下圖所以,每幀的幀號在右上角所示。這個視頻的光照變化是挺大的,但是簡單的模板匹配方法還是可以挺有效的進行跟蹤的,而且速度很快,在這個視頻中,只花費了1ms左右(耗時的長度與目標框的大小和機器的性能有關)。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM