在學習Pytorch的時候,先學會如何正確創建或者加載數據,至關重要。
有了數據,很多函數,操作的效果就變得很直觀。
本文主要用其他庫讀取圖像文件(學會這個,你就可以在之后的學習中,將一些效果直觀化)
更好的文章組織結構:
零:准備
加載數據前,需要掌握正確的讀取路徑方法。很多教程中的例子,在講解的時候,沒有提供圖片,或者讀者不知道修改教程中的讀取路徑,打擊了熱情。
建議:為了保證大家可以跟着教程一步一步練習,教程中會出現示例圖片,建議大家右鍵-另存為圖片,將圖片保存到 你運行程序的文件夾 中。如下圖:
壹:數據集的准備
任務:我們用不同的方式讀取這兩張圖片(記得右鍵-另存為圖片,保存到程序所在位置,記得文件重命名為你喜歡的方式,我的重命名為002.jpg
和003.jpg
將文件另存為后,同時新建一個python文件,我的效果如下:
接下來,我們就可以在load_images.py
中,進行相關操作了。
貳:用其他庫讀取圖像文件
- 使用
matplotlib
庫進行圖像的讀取
matplotlib
中的函數跟Matlab很像。
我們需要使用matplotlib.pyplot
中的函數:
imread(文件地址)
:進行讀取圖像的操作(參數為讀取圖像文件的路徑)
imshow(數組)
:進行圖像的顯示操作(顯示圖像的數組)
show()
:顯示一個窗口,用於顯示圖像(很多時候,不顯示圖像的話,是忘記使用這個函數)
我們嘗試探討,圖像被讀取后的數據類型,大小形狀
import matplotlib.pyplot as plt
img = plt.imread('002.jpg')
#圖片的高H為460,寬W為346,顏色通道C為3
print(img.shape)
print(img.dtype)
print(type(img))
plt.imshow(img)
plt.show()
輸出為:
(460, 346, 3)
uint8
<class 'numpy.ndarray'>
結論:imread
讀取的圖片為numpy.ndarry
的數組,數組的大小排列為:高×寬×通道數,數組的數據類型是uint8
,即每個數據的大小為[0,255]
如果不想手動進行多圖像的讀取,需要使用到Python的文件,路徑操作等。暫不介紹
手動添加的話,就是用[array1,array2]
這種形式,將數組進行連接
import matplotlib.pyplot as plt
img1 = plt.imread('002.jpg')
img2 = plt.imread('003.jpg')
img = [img1, img2]
for i in img:
plt.imshow(i)
plt.show()
- 使用
cv2
進行圖像的讀取
在cv2
庫中,需要用到的函數有:
imread(文件地址)
:讀取地址處的文件圖像
imshow('窗口名稱', 圖像數組)
:將圖像數組顯示出來,但必須結合waitKey()
使用,否則無法顯示圖像
waitKey(延遲時間)
:需要設置延遲時間,當延遲時間≤0時,窗口將會一直延遲,延遲無窮長時間,按下任一按鍵,可以繼續執行下面程序。當延遲時間>0,即窗口圖像會顯示對應毫秒后,自動消失。
import cv2
img1 = cv2.imread('002.jpg')
print(img1.shape)
print(img1.dtype)
print(type(img1))
cv2.imshow('img', img1)
cv2.waitKey(0)
輸出為:
(460, 346, 3)
uint8
<class 'numpy.ndarray'>
結論:imread讀取的圖片為
numpy.ndarry的數組,數組的大小排列為:高×寬×通道數,數組的數據類型是
uint8`,即每個數據的大小為[0,255]
Matplotlib與cv2對圖像的數據格式的處理是相似的,但是也是有區別的:
對於通道的讀取,cv2是按BGR的順序讀入,而matplotlib按RGB的順序讀入
- 使用
PIL
庫進行圖像處理
PIL
全稱為Python Image Library
。是給Python提供圖像處理相關的庫。
需要使用到的函數:
open(文件地址)
:打開文件,注意是打開,並沒有讀取。主要作用是保持檢查文件地址,同時保證文件是打開的狀態。當對圖像處理的時候,會自動加載。
show()
:使用系統自帶的圖像查看器,查看圖像
from PIL import Image
img1 = Image.open('002.jpg')
# 因為PIL有自己的數據結構,所以沒有shape,dtype屬性
# print(img1.shape)
# print(img1.dtype)
print(type(img1))
img1.show()
輸出為:
<class 'PIL.JpegImagePlugin.JpegImageFile'>
我們可以使用numpy.array()
函數,將PIL
結構的數據轉換成numpy
數組。
import matplotlib.pyplot as plt
from PIL import Image
import numpy as np
img1 = Image.open('002.jpg')
img1 = np.array(img1)
print(img1.shape)
print(img1.dtype)
plt.imshow(img1)
plt.show()
輸出:
(460, 346, 3)
uint8
可以看到,PIL轉換成numpy后,數據類型是uint8的。
叄:總結
主要介紹了使用matplotlib
,cv2
,PIL
庫進行圖像文件的讀取
matplotlib
中的imread
,imshow
,show
函數cv2
中的imread
,imshow
,waitKey
函數PIL
中的open
,show
函數