深度學習訓練數據打標簽過程
為了獲取大量的圖片訓練數據,在采集數據的過程中常用視頻的方式采集數據,但對於深度學習,訓練的過程需要很多的有有標簽的數據,這篇文章主要是解決視頻文件轉換成圖片文件,並加標簽,最后把數據存儲到pkl文件中,為后續深度學習提供數據。
1. video to image
- 這個應用,主要是把視頻切分成圖片,並保存到本地,可以自定義切分的時間間隔;
- 在深度學習中,由於場景的需要,有時候需要自己動手去做圖片的標注,但是我們在采取數據的時候,多把數據保存成視頻的形式,對於視頻的信息不好進行標注。對於視頻轉換成圖片,可以通過播放視頻,然后通過截圖的方式把所需要的圖片保存到本地,但是這樣子的話,工作效率很很低。所以,為解決這個麻煩的過程,我先把視頻的數據一幀一幀的讀取進來,並生成成圖片保存到本地,節省了大量的時間。
具體代碼實現過程
# 導入所需要的庫
import cv2
import numpy as np
# 定義保存圖片函數
# image:要保存的圖片名字
# addr;圖片地址與相片名字的前部分
# num: 相片,名字的后綴。int 類型
def save_image(image,addr,num):
address = addr + str(num)+ '.jpg'
cv2.imwrite(address,image)
# 讀取視頻文件
videoCapture = cv2.VideoCapture("./input/chen6.30.mp4")
# 通過攝像頭的方式
# videoCapture=cv2.VideoCapture(1)
#讀幀
success, frame = videoCapture.read()
i = 0
while success :
i = i + 1
save_image(frame,'./output/img_',i)
if success:
print('save image:',i)
success, frame = videoCapture.read()
save image: 1
save image: 2
save image: 3
save image: 4
save image: 5
save image: 6......
2. 對於生成的圖片添加label,並保存成pkl格式
- 在這里只選擇兩張圖片進行舉例。
import numpy as np
from PIL import Image
import pickle
import matplotlib.pyplot as plt
%matplotlib inline
2.1 讀取圖片
img_640 = Image.open('./output/img_640.jpg')
img_910 = Image.open('./output/img_910.jpg')
# 顯示圖片
plt.imshow(img_640)
<matplotlib.image.AxesImage at 0x15ece1330b8>
2.2 把圖片數據轉換成numpy.ndarray
img_640_n = np.array(img_640)
img_910_n = np.array(img_910)
type(img_640_n)
numpy.ndarray
2.3 對數據進行保存
# 創建一個空list,用於存儲圖像數據因為是兩張圖片說以創建2個(480, 640, 3)的矩陣。
image_data = []
# 把數據存放進來
image_data.append(img_640_n)
image_data.append(imgh_910_n)
# 添加標簽,假設這兩張圖片是兩個類別,把他們標注為類型1和2
image_data_label = np.empty(2)
image_data_label[0] = 1
image_data_label[1] = 2
# 把標簽的類型轉換成int類型,為了方便出來也把data轉換成numpy.ndarray類型
image_data = np.array(image_data)
image_data_label=image_data_label.astype(np.int)
image_data_label
array([1, 2])
plt.imshow(image_data[1])
<matplotlib.image.AxesImage at 0x15ece1845f8>
2.4 把數據保存到pkl文件中
# 把數據合並成一個元組進行保存
train_data = (image_data,image_data_label)
# 把數據寫入pkl文件中
write_file=open('./input/train_data.pkl','wb')
pickle.dump(train_data,write_file)
write_file.close()
3.讀取圖片標簽和數據
# 從pkl文件中讀取圖片數據和標簽
read_file=open('./input/train_data.pkl','rb')
(train_data,lab_data)=pickle.load(read_file)
read_file.close()
# 查看讀取出來的數據
train_data.shape
(2, 480, 640, 3)
lab_data
array([1, 2])
plt.imshow(train_data[0])
<matplotlib.image.AxesImage at 0x15ece1daa20>
到這里就完成了把圖片加標簽后存儲與讀取,為后續神經網絡數據的輸入做准備,當我們需要數據的時候,把pkl文件加載進來就可以。