python+opencv人臉識別是否戴口罩

本文轉載自查看原文 2021-08-12 07:49 207 python/ java/ 人臉識別戴口罩/ opencv

當今疫情情況下，檢測是否戴口罩還是比較流行的，然后就搞啦一個檢測人臉是否戴口罩的程序。程序調用筆記本攝像頭，實時檢測人臉是否佩戴口罩。

一、數據集

如果數據集大家有，就用自己的。沒有的話，也可以找我要啊（3000+戴口罩/1000+不戴口罩）。在此就不分享出來了，我也是找別人要的。

二、開始上代碼

1、導入keras庫

1 import keras
2 keras.__version__

2、創建train、test、validation文件夾，並且三個文件夾里面都有have_mask和no_mask文件，運行之后將數據集中的照片放入對應的文件夾中。

 1 import os, shutil
 2 # The path to the directory where the original
 3 # dataset was uncompressed
 4 original_dataset_dir = 'F:\\PyCharm\\facemask\\mask'
 5 
 6 # The directory where we will
 7 # store our smaller dataset
 8 base_dir = 'F:\\PyCharm\\facemask\\mask_and_nomask'
 9 os.mkdir(base_dir)
10 
11 # Directories for our training,
12 # validation and test splits
13 train_dir = os.path.join(base_dir, 'train')
14 os.mkdir(train_dir)
15 validation_dir = os.path.join(base_dir, 'validation')
16 os.mkdir(validation_dir)
17 test_dir = os.path.join(base_dir, 'test')
18 os.mkdir(test_dir)
19 
20 # Directory with our training smile pictures
21 train_smile_dir = os.path.join(train_dir, 'have_mask')
22 os.mkdir(train_smile_dir)
23 
24 # Directory with our training nosmile pictures
25 train_nosmile_dir = os.path.join(train_dir, 'no_mask')
26 os.mkdir(train_nosmile_dir)
27 
28 # Directory with our validation smile pictures
29 validation_smile_dir = os.path.join(validation_dir, 'have_mask')
30 os.mkdir(validation_smile_dir)
31 
32 # Directory with our validation nosmile pictures
33 validation_nosmile_dir = os.path.join(validation_dir, 'no_mask')
34 os.mkdir(validation_nosmile_dir)
35 
36 # Directory with our validation smile pictures
37 test_smile_dir = os.path.join(test_dir, 'have_mask')
38 os.mkdir(test_smile_dir)
39 
40 # Directory with our validation nosmile pictures
41 test_nosmile_dir = os.path.join(test_dir, 'no_mask')
42 os.mkdir(test_nosmile_dir)

3、記數，統計一下各個文件中照片的數量

1 print('total training smile images:', len(os.listdir(train_smile_dir)))
2 print('total training nosmile images:', len(os.listdir(train_nosmile_dir)))
3 print('total validation smile images:', len(os.listdir(validation_smile_dir)))
4 print('total validation nosmile images:', len(os.listdir(validation_nosmile_dir)))
5 print('total test smile images:', len(os.listdir(test_smile_dir)))
6 print('total test nosmile images:', len(os.listdir(test_nosmile_dir)))

4、構建小型卷積網絡

我們已經為MNIST構建了一個小型卷積網，所以您應該熟悉它們。我們將重用相同的通用結構:我們的卷積網將是一個交替的Conv2D(激活relu)和MaxPooling2D層的堆棧。然而，由於我們處理的是更大的圖像和更復雜的問題，因此我們將使我們的網絡相應地更大:它將有一個更多的Conv2D + MaxPooling2D階段。這樣既可以擴大網絡的容量，又可以進一步縮小特征圖的大小，這樣當我們到達平坦層時，特征圖就不會太大。在這里，由於我們從大小為150x150的輸入開始(有點隨意的選擇)，我們在Flatten層之前得到大小為7x7的feature map。

注意：feature map的深度在網絡中逐漸增加(從32到128)，而feature map的大小在減少(從148x148到7x7)。這是你會在幾乎所有convnets中看到的模式。由於我們解決的是一個二元分類問題，我們用一個單一單元(一個大小為1的稠密層)和一個s型激活來結束網絡。這個單元將對網絡正在查看一個類或另一個類的概率進行編碼。

 1 from keras import layers
 2 from keras import models
 3 
 4 model = models.Sequential()
 5 model.add(layers.Conv2D(32, (3, 3), activation='relu',
 6                         input_shape=(150, 150, 3)))
 7 model.add(layers.MaxPooling2D((2, 2)))
 8 model.add(layers.Conv2D(64, (3, 3), activation='relu'))
 9 model.add(layers.MaxPooling2D((2, 2)))
10 model.add(layers.Conv2D(128, (3, 3), activation='relu'))
11 model.add(layers.MaxPooling2D((2, 2)))
12 model.add(layers.Conv2D(128, (3, 3), activation='relu'))
13 model.add(layers.MaxPooling2D((2, 2)))
14 model.add(layers.Flatten())
15 model.add(layers.Dense(512, activation='relu'))
16 model.add(layers.Dense(1, activation='sigmoid'))

5、輸出模型各層的參數狀況

1 model.summary()

6、告知訓練時用的優化器、損失函數和准確率評測標准

1 from keras import optimizers
2 
3 model.compile(loss='binary_crossentropy',
4               optimizer=optimizers.RMSprop(lr=1e-4),
5               metrics=['acc'])

7、數據預處理

在將數據輸入到我們的網絡之前，應該將數據格式化為經過適當預處理的浮點張量。目前，我們的數據以JPEG文件的形式保存在硬盤上，因此將其導入網絡的步驟大致如下:

讀取圖片文件
解碼JPEG內容到RBG像素網格
把它們轉換成浮點張量
將像素值(從0到255)縮放到[0,1]區間

 1 from keras.preprocessing.image import ImageDataGenerator
 2 
 3 # All images will be rescaled by 1./255
 4 train_datagen = ImageDataGenerator(rescale=1./255)
 5 test_datagen = ImageDataGenerator(rescale=1./255)
 6 
 7 train_generator = train_datagen.flow_from_directory(
 8         # This is the target directory
 9         train_dir,
10         # All images will be resized to 150x150
11         target_size=(150, 150),
12         batch_size=20,
13         # Since we use binary_crossentropy loss, we need binary labels
14         class_mode='binary')
15 
16 validation_generator = test_datagen.flow_from_directory(
17         validation_dir,
18         target_size=(150, 150),
19         batch_size=20,
20         class_mode='binary')

讓我們看看其中一個生成器的輸出：它生成150×150 RGB圖像的批次(Shape(20,150,150，3))和二進制標簽(Shape(20，))。20是每批樣品的數量(批次大小)。注意，生成器無限期地生成這些批：它只是無休止地循環目標文件夾中的圖像。因此，我們需要在某個點中斷迭代循環。

1 for data_batch, labels_batch in train_generator:
2     print('data batch shape:', data_batch.shape)
3     print('labels batch shape:', labels_batch.shape)
4     break

使用生成器使我們的模型適合於數據

1 history = model.fit_generator(
2       train_generator,
3       steps_per_epoch=100,
4       epochs=50,
5       validation_data=validation_generator,
6       validation_steps=50)

保存模型

1 model.save('F:\\PyCharm\\facemask\\mask_and_nomask\\test\\mask_and_nomask.h5')

在訓練和驗證數據上繪制模型的損失和准確性

 1 import matplotlib.pyplot as plt
 2 
 3 acc = history.history['acc']
 4 val_acc = history.history['val_acc']
 5 loss = history.history['loss']
 6 val_loss = history.history['val_loss']
 7 
 8 epochs = range(len(acc))
 9 
10 plt.plot(epochs, acc, 'bo', label='Training acc')
11 plt.plot(epochs, val_acc, 'b', label='Validation acc')
12 plt.title('Training and validation accuracy')
13 plt.legend()
14 
15 plt.figure()
16 
17 plt.plot(epochs, loss, 'bo', label='Training loss')
18 plt.plot(epochs, val_loss, 'b', label='Validation loss')
19 plt.title('Training and validation loss')
20 plt.legend()
21 plt.show()

8、數據准確性提高

1 datagen = ImageDataGenerator(
2       rotation_range=40,
3       width_shift_range=0.2,
4       height_shift_range=0.2,
5       shear_range=0.2,
6       zoom_range=0.2,
7       horizontal_flip=True,
8       fill_mode='nearest')

查看提高后的圖像

 1 # This is module with image preprocessing utilities
 2 from keras.preprocessing import image
 3 
 4 fnames = [os.path.join(train_smile_dir, fname) for fname in os.listdir(train_smile_dir)]
 5 
 6 # We pick one image to "augment"
 7 img_path = fnames[3]
 8 
 9 # Read the image and resize it
10 img = image.load_img(img_path, target_size=(150, 150))
11 
12 # Convert it to a Numpy array with shape (150, 150, 3)
13 x = image.img_to_array(img)
14 
15 # Reshape it to (1, 150, 150, 3)
16 x = x.reshape((1,) + x.shape)
17 
18 # The .flow() command below generates batches of randomly transformed images.
19 # It will loop indefinitely, so we need to `break` the loop at some point!
20 i = 0
21 for batch in datagen.flow(x, batch_size=1):
22     plt.figure(i)
23     imgplot = plt.imshow(image.array_to_img(batch[0]))
24     i += 1
25     if i % 4 == 0:
26         break
27 
28 plt.show()

如果我們使用這種數據增加配置訓練一個新的網絡，我們的網絡將永遠不會看到兩次相同的輸入。然而，它看到的輸入仍然是高度相關的，因為它們來自少量的原始圖像——我們不能產生新的信息，我們只能混合現有的信息。因此，這可能還不足以完全消除過度擬合。

為了進一步對抗過擬合，我們還將在我們的模型中增加一個Dropout層，就在密集連接分類器之前：

 1 model = models.Sequential()
 2 model.add(layers.Conv2D(32, (3, 3), activation='relu',
 3                         input_shape=(150, 150, 3)))
 4 model.add(layers.MaxPooling2D((2, 2)))
 5 model.add(layers.Conv2D(64, (3, 3), activation='relu'))
 6 model.add(layers.MaxPooling2D((2, 2)))
 7 model.add(layers.Conv2D(128, (3, 3), activation='relu'))
 8 model.add(layers.MaxPooling2D((2, 2)))
 9 model.add(layers.Conv2D(128, (3, 3), activation='relu'))
10 model.add(layers.MaxPooling2D((2, 2)))
11 model.add(layers.Flatten())
12 model.add(layers.Dropout(0.5))
13 model.add(layers.Dense(512, activation='relu'))
14 model.add(layers.Dense(1, activation='sigmoid'))
15 
16 model.compile(loss='binary_crossentropy',
17               optimizer=optimizers.RMSprop(lr=1e-4),
18               metrics=['acc'])

用數據增強和退出來訓練我們的網絡:

 1 train_datagen = ImageDataGenerator(
 2     rescale=1./255,
 3     rotation_range=40,
 4     width_shift_range=0.2,
 5     height_shift_range=0.2,
 6     shear_range=0.2,
 7     zoom_range=0.2,
 8     horizontal_flip=True,)
 9 
10 # Note that the validation data should not be augmented!
11 test_datagen = ImageDataGenerator(rescale=1./255)
12 
13 train_generator = train_datagen.flow_from_directory(
14         # This is the target directory
15         train_dir,
16         # All images will be resized to 150x150
17         target_size=(150, 150),
18         batch_size=32,
19         # Since we use binary_crossentropy loss, we need binary labels
20         class_mode='binary')
21 
22 validation_generator = test_datagen.flow_from_directory(
23         validation_dir,
24         target_size=(150, 150),
25         batch_size=32,
26         class_mode='binary')
27 
28 history = model.fit_generator(
29       train_generator,
30       steps_per_epoch=100,
31       epochs=150,
32       validation_data=validation_generator,
33       validation_steps=50)

這里程序會跑很久，我跑了幾個小時，用GPU跑會快很多很多。

保存模型在convnet可視化部分使用：

1 model.save('F:\\PyCharm\\facemask\\mask_and_nomask\\test\\mask_and_nomask.h5')

看一下結果：（挺好的）

 1 acc = history.history['acc']
 2 val_acc = history.history['val_acc']
 3 loss = history.history['loss']
 4 val_loss = history.history['val_loss']
 5 
 6 epochs = range(len(acc))
 7 
 8 plt.plot(epochs, acc, 'bo', label='Training acc')
 9 plt.plot(epochs, val_acc, 'b', label='Validation acc')
10 plt.title('Training and validation accuracy')
11 plt.legend()
12 
13 plt.figure()
14 
15 plt.plot(epochs, loss, 'bo', label='Training loss')
16 plt.plot(epochs, val_loss, 'b', label='Validation loss')
17 plt.title('Training and validation loss')
18 plt.legend()
19 plt.show()

8、優化提高笑臉圖像分類模型精度
構建卷積網絡

 1 from keras import layers
 2 from keras import models
 3 from keras import optimizers
 4 model = models.Sequential()
 5 #輸入圖片大小是150*150 3表示圖片像素用(R,G,B)表示
 6 model.add(layers.Conv2D(32, (3,3), activation='relu', input_shape=(150 , 150, 3)))
 7 model.add(layers.MaxPooling2D((2,2)))
 8 model.add(layers.Conv2D(64, (3,3), activation='relu'))
 9 model.add(layers.MaxPooling2D((2,2)))
10 model.add(layers.Conv2D(128, (3,3), activation='relu'))
11 model.add(layers.MaxPooling2D((2,2)))
12 model.add(layers.Conv2D(128, (3,3), activation='relu'))
13 model.add(layers.MaxPooling2D((2,2)))
14 model.add(layers.Flatten())
15 model.add(layers.Dense(512, activation='relu'))
16 model.add(layers.Dense(1, activation='sigmoid'))
17 model.compile(loss='binary_crossentropy', optimizer=optimizers.RMSprop(lr=1e-4),
18              metrics=['acc'])
19 model.summary()

三、代碼測試

 1 import cv2
 2 from keras.preprocessing import image
 3 from keras.models import load_model
 4 import numpy as np
 5 import dlib
 6 from PIL import Image
 7 model = load_model('mask_and_nomask.h5')
 8 detector = dlib.get_frontal_face_detector()
 9 video=cv2.VideoCapture(0)
10 font = cv2.FONT_HERSHEY_SIMPLEX
11 def rec(img):
12     gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
13     dets=detector(gray,1)
14     if dets is not None:
15         for face in dets:
16             left=face.left()
17             top=face.top()
18             right=face.right()
19             bottom=face.bottom()
20             cv2.rectangle(img,(left,top),(right,bottom),(0,255,0),2)
21             img1=cv2.resize(img[top:bottom,left:right],dsize=(150,150))
22             img1=cv2.cvtColor(img1,cv2.COLOR_BGR2RGB)
23             img1 = np.array(img1)/255.
24             img_tensor = img1.reshape(-1,150,150,3)
25             prediction =model.predict(img_tensor)    
26             print(prediction)
27             if prediction[0][0]>0.5:
28                 result='nomask'
29             else:
30                 result='mask'
31             cv2.putText(img, result, (left,top), font, 2, (0, 255, 0), 2, cv2.LINE_AA)
32         cv2.imshow('mask detector', img)
33 while video.isOpened():
34     res, img_rd = video.read()
35     if not res:
36         break
37     rec(img_rd)
38     if cv2.waitKey(1) & 0xFF == ord('q'):
39         break
40 video.release()
41 cv2.destroyAllWindows()

這里就不上運行結果了。

本文轉載：https://blog.csdn.net/weixin_45137708/article/details/107142706

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 戴口罩的人臉識別 Python的人臉自動戴口罩系統寫給程序員的機器學習入門 (十) - 對象識別 Faster-RCNN - 識別人臉位置與是否戴口罩寫給程序員的機器學習入門 (十一) - 對象識別 YOLO - 識別人臉位置與是否戴口罩圖像識別 python+opencv的簡單人臉識別基於python+opencv的簡易人臉識別打卡系統 Python+OpenCV實現AI人臉識別身份認證系統(1)—人臉識別原理寫給程序員的機器學習入門 (十補充) - 對象識別 Faster-RCNN - 改進識別人臉位置與是否戴口罩的模型基於python+opencv的人臉檢測+ python opencv 人臉識別