opencv訓練xml文件


一. 引入

 

    opencv人臉識別大家應該都聽說過,本篇目的是利用opencv從視頻幀中識別指定的物體,並框出來,且可以保存截取到的物體圖片,會將整個流程都講一下,包括訓練自己的分類器,使用訓練好的分類器進行識別。這里以識別舌頭為例。

 

 

二.  環境:

 

    1.  python 3.6.3

    2. opencv 3.4.0

 

三. 訓練自己的分類器

 

 

1. 注意點:訓練集分為正樣本,負樣本,樣本全部為灰度圖片,正樣本圖片尺寸需要固定,一般40*40左右即可,大了電腦跑不動,負樣本尺寸不固定,負樣本數量要比正樣本多才行,少了有問題。

圖片批量縮小工具下載:鏈接:https://pan.baidu.com/s/1pMAp19p 密碼:vpp1

圖片批量灰度處理:使用美圖秀秀

 

2. 正樣本制作,使用美圖秀秀將舌頭的圖片全部裁剪出來(尺寸一致為:40*40的),保存到一個文件夾pos中,當然可以先用大尺寸正方形框進行裁剪,然后再用圖片縮小工具進行制定尺寸縮小。最后再用美圖秀秀批量灰度化。

附上名字自動有序化Java代碼:

String path = "C:\\Users\\Administrator\\Desktop\\pos\\";

                  File f = new File(path);

                  File[] files = f.listFiles();

                  for (File file : files) {

                          i++;

                          file.renameTo(new File(path+i+"."+file.getName().split("\\.")[1]));

                  }

處理后得到如下所示圖片:

 

3. 負樣本制作:如上操作類似,不過這里不要求尺寸一樣,但是負樣本圖片中一定不要包含待識別的區域(如這里的:舌頭)

如下所示:

 

 

 

4. 生成樣本資源記錄文件:

 

a. 正樣本資源記錄文件

 

新建pos文件夾,將正樣本的灰度圖拷貝進去

使用JAVA代碼生成正樣本資源記錄文件:

String path = "E:\\tools\\python\\eclipse\\work\\pythonTest\\demo\\0202\\img\\train\\tongue\\pos\\";

                  File txtfile = new File(path+"pos.txt");

                  FileOutputStream fos = new FileOutputStream(txtfile);

                  PrintWriter pw = new PrintWriter(fos,true);

                  String s = "";

                  File[] files = new File(path).listFiles();

                  for (File file : files) {

                          pw.println("pos/"+file.getName()+" 1 0 0 40 40");

                  }

生成后刪除最后一行的帶有(pos.txt)的內容,讓正樣本資源記錄文件內容如下類似所示:

 

 

(1 0 0 40 40)分別指代: 數量  左上方的坐標位置(x,y)  右下方的坐標位置(x,y)

處理好后,將pos.txt 移動到上一級文件夾

 

 

b. 負樣本資源記錄文件

 

新建neg文件夾,將負樣本的灰度圖拷貝進去

使用JAVA代碼生成負樣本資源記錄文件:

String path = "E:\\tools\\python\\eclipse\\work\\pythonTest\\demo\\0202\\img\\train\\tongue\\neg\\";

                  File txtfile = new File(path+"neg.txt");

                  FileOutputStream fos = new FileOutputStream(txtfile);

                  PrintWriter pw = new PrintWriter(fos,true);

                  String s = "";

                  File[] files = new File(path).listFiles();

                  for (File file : files) {

                          pw.println("neg/"+file.getName());

                         

                  }

生成后刪除最后一行的帶有(neg.txt)的內容,讓負樣本資源記錄文件內容如下類似所示:

 

 

處理好后,將negtxt 移動到上一級文件夾

 

得到如圖所示文件夾結構:

 

 

 

5. 使用opencv提供的opencv_createsamples.exe程序生成樣本vec文件,新建批處理文件:createsamples.bat

內容如下:

 

opencv_createsamples.exe -vec pos.vec -info pos.txt -num 25 -w 40 -h 40

pause

說明:25是正樣本圖片的數量   40 40 是正樣本圖片的寬高

 

這些參數的詳細解釋:http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/user_guide/ug_traincascade.html

 

運行后會生成 pos.vec文件

 

 

6. 使用opencv提供的opencv_traincascade.exe程序訓練分類器,新建xml文件夾,再新建批處理文件:LBP_train.bat

內容如下:

 

opencv_traincascade.exe -data xml -vec pos.vec -bg neg.txt -numPos 25 -numNeg 666 -numStages 10 -w 40 -h 40 -minHitRate 0.999 -maxFalseAlarmRate 0.2 -weightTrimRate 0.95 -featureType LBP

pause

說明: 25是正樣本圖片的數量   666是負樣本圖片的數量   numNeg是層級數  40 40是訓練樣本的寬高 .....

具體參數解釋請查看文檔:http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/user_guide/ug_traincascade.html

 

運行后會在xml文件夾生成如下文件:

 

 

其中cascade.xml是我們需要使用的分類器

 

 

四 . 測試訓練好的分類器

 

 

'''

Created on 2018年2月2日

實時人臉檢測

@author: nuohy

'''

import cv2

 

# 加載opencv自帶的人臉分類器

# faceCascade = cv2.CascadeClassifier("haarcascade_frontalface_alt2.xml")

# faceCascade.load('E:/python/opencv/opencv/sources/data/haarcascades/haarcascade_frontalface_alt2.xml')

 

faceCascade = cv2.CascadeClassifier("cascade.xml")

faceCascade.load('E:/tools/python/eclipse/work/pythonTest/demo/0202/img/train/tongue/xml/cascade.xml')

 

cap = cv2.VideoCapture(0)

flag = 0

timeF = 10

while True:

    flag+=1

    ret, frame = cap.read()

    img = frame.copy()

    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    rect = faceCascade.detectMultiScale(

        gray,

        scaleFactor=1.15,

        minNeighbors=3,

        minSize=(3,3),

        flags = cv2.IMREAD_GRAYSCALE

    )

    for (x, y, w, h) in rect:

        cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)

        #識別到物體后進行裁剪保存

        #jiequ = img[x:(x+w), y:(y+h)]

        #cv2.imwrite('E://tools//python//eclipse//work//pythonTest//demo//0202//img//save//'+str(flag) + '.jpg',jiequ) #save as jpg

 

    #讀取到保存圖片

#     if(flag%timeF==0):

#         cv2.imwrite('E://tools//python//eclipse//work//pythonTest//demo//0202//img//save//'+str(flag) + '.jpg',frame) #save as jpg

 

 

    cv2.imshow('frame', frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):

        break

cap.release()

cv2.destroyAllWindows()

 

 效果圖如下所示:

 

 

 

 

---------------------

作者:Nuohy

來源:CSDN

原文:https://blog.csdn.net/qq_27063119/article/details/79247266

版權聲明:本文為博主原創文章,轉載請附上博文鏈接!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM