學校里有門圖像處理的課程最終需要提交一個圖像處理系統,
正好之前對於opencv有些了解,就簡單的寫一個人臉識別小程序吧
效果圖如下
筆者IDE使用Pycharm,GUI編程直接使用內置的tkinter
環境:
python3.6
opencv4.1
首先導入需要使用的各個庫
#-*- coding: utf-8 -*- import sys import importlib import cv2 import tkinter as tk import tkinter.messagebox from tkinter import filedialog
之后我們需要做一個路徑選擇函數,因為畢竟不能每次識別而去手動改代碼內的地址
而這個函數我們稍后會綁定至一個button方便使用
def selectPath(): global path_ path_ = filedialog.askopenfilename() path.set(path_) path = tk.StringVar()
最關鍵的人臉識別函數
其中所使用到的訓練參數數據下載地址:https://github.com/opencv/opencv/tree/master/data/haarcascades
並且xml文件需要放到項目目錄下
def imgface(): try: # github獲取訓練好的人臉的參數數據 face_cascade = cv2.CascadeClassifier(r'./haarcascade_frontalface_default.xml') # 讀取圖片 image = cv2.imread(path_) #轉化為灰度圖 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 探測圖片中的人臉 faces = face_cascade.detectMultiScale( gray, scaleFactor=1.15, minNeighbors=5, minSize=(5, 5), flags=cv2.IMREAD_GRAYSCALE) if(len(faces)==0): tkinter.messagebox.showerror('錯誤', '未識別出人臉,請選擇更為清晰的圖片') print("find {0} faces!".format(len(faces))) # faces中的四個量分別為左上角的橫坐標、縱坐標、寬度、長度 for (x, y, w, h) in faces: cv2.rectangle(image,(x,y),(x+w,y+w),(255,245,0),1) if (len(faces) > 0): cv2.imshow("find {0} faces!".format(len(faces)), image) cv2.waitKey(0) except: tkinter.messagebox.showerror('錯誤', '請選擇正確的圖片文件!')
之后進行GUI編程:
importlib.reload(sys) window = tk.Tk() window.title('人臉識別小程序') fm1 = tk.Frame(window) fm2 = tk.Frame(window) fm3 = tk.Frame(window) def selectPath(): global path_ path_ = filedialog.askopenfilename() path.set(path_) path = tk.StringVar() Ltop=tk.Label(fm1,text="請選擇圖片路徑") B1=tk.Button(fm2, text = "路徑選擇", command = selectPath) E1=tk.Entry(fm2, textvariable = path,bd=5) B2=tk.Button(fm2, text = "確定", command =imgface) Lbot=tk.Label(fm3,text="學號:1622107031xx 姓名:istw") Ltop.pack(side = tk.TOP) B1.pack(side=tk.LEFT) E1.pack(side = tk.LEFT) B2.pack(side=tk.LEFT) Lbot.pack(side = tk.BOTTOM) fm1.pack(side=tk.TOP) fm2.pack(side=tk.TOP) fm3.pack(side=tk.TOP) sw = window.winfo_screenwidth() #得到屏幕寬度 sh = window.winfo_screenheight() #得到屏幕高度 ww = 300 wh = 100 #窗口寬高為100 x = (sw-ww) / 2 y = (sh-wh) / 3 window.geometry("%dx%d+%d+%d" %(ww,wh,x,y)) window.mainloop()
怎么樣,一個簡單的有交互界面的小程序就寫出來了,只不過因為運用的人臉訓練數據是官方提供的好多年前的,所以識別精度並不會太准
整個工程代碼如下:
#-*- coding: utf-8 -*- import sys import importlib import cv2 import tkinter as tk import tkinter.messagebox from tkinter import filedialog def imgface(): try: # github獲取訓練好的人臉的參數數據 face_cascade = cv2.CascadeClassifier(r'./haarcascade_frontalface_default.xml') # 讀取圖片 image = cv2.imread(path_) #轉化為灰度圖 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 探測圖片中的人臉 faces = face_cascade.detectMultiScale( gray, scaleFactor=1.15, minNeighbors=5, minSize=(5, 5), flags=cv2.IMREAD_GRAYSCALE) if(len(faces)==0): tkinter.messagebox.showerror('錯誤', '未識別出人臉,請選擇更為清晰的圖片') print("find {0} faces!".format(len(faces))) # faces中的四個量分別為左上角的橫坐標、縱坐標、寬度、長度 for (x, y, w, h) in faces: cv2.rectangle(image,(x,y),(x+w,y+w),(255,245,0),1) if (len(faces) > 0): cv2.imshow("find {0} faces!".format(len(faces)), image) cv2.waitKey(0) except: tkinter.messagebox.showerror('錯誤', '請選擇正確的圖片文件!') importlib.reload(sys) window = tk.Tk() window.title('人臉識別小程序') fm1 = tk.Frame(window) fm2 = tk.Frame(window) fm3 = tk.Frame(window) def selectPath(): global path_ path_ = filedialog.askopenfilename() path.set(path_) path = tk.StringVar() Ltop=tk.Label(fm1,text="請選擇圖片路徑") B1=tk.Button(fm2, text = "路徑選擇", command = selectPath) E1=tk.Entry(fm2, textvariable = path,bd=5) B2=tk.Button(fm2, text = "確定", command =imgface) Lbot=tk.Label(fm3,text="學號:1622107031xx 姓名:istw") Ltop.pack(side = tk.TOP) B1.pack(side=tk.LEFT) E1.pack(side = tk.LEFT) B2.pack(side=tk.LEFT) Lbot.pack(side = tk.BOTTOM) fm1.pack(side=tk.TOP) fm2.pack(side=tk.TOP) fm3.pack(side=tk.TOP) sw = window.winfo_screenwidth() #得到屏幕寬度 sh = window.winfo_screenheight() #得到屏幕高度 ww = 300 wh = 100 #窗口寬高為100 x = (sw-ww) / 2 y = (sh-wh) / 3 window.geometry("%dx%d+%d+%d" %(ww,wh,x,y)) window.mainloop()
還有一個問題就是關於.py文件如何向別人展示的問題,因為不是每個人的電腦中都有py環境的,並且各個版本也不兼容,所以我們為了方便展示,有時候會運用些方法將其轉換為exe文件,這個以后會講到。