使用深度學習識別狗的品種

本文轉載自查看原文 2020-09-14 22:02 924

作者|Nouman
編譯|VK
來源|Towards Data Science

在這篇文章中，我將教你建立你自己的網頁應用程序，它將接受你的狗的圖片，並輸出其品種。准確率超過80%！

我們將使用深度學習來訓練一個模型的數據集的狗圖像與他們的品種，以學習的特征來區分每一個品種。

數據分析

數據集可以從這里下載（https://s3-us-west-1.amazonaws.com/udacity-aind/dog-project/dogImages.zip）。在成功加載和瀏覽數據集后，以下是關於數據的一些介紹：

犬種總數：133
狗圖片總數：8351（訓練集：6680，驗證集：835，測試集：836）
最受歡迎的品種：阿拉斯加：96，博德牧羊犬：93

按圖片數量排序的前30個品種如下：

我們還可以在這里看到一些狗的圖片和它們的品種：

數據預處理

經過分析，為機器學習算法准備數據。我們將把每個圖像作為一個numpy數組加載，並將它們的大小調整為224x224，因為這是大多數傳統神經網絡接受圖像的默認大小。我們還將為圖像的數量添加另一個維度

from keras.preprocessing import image                  
from tqdm import tqdm

def path_to_tensor(img_path):
    '''將給定路徑下的圖像轉換為張量'''
    img = image.load_img(img_path, target_size=(224, 224))
    x = image.img_to_array(img)
    return np.expand_dims(x, axis=0)

def paths_to_tensor(img_paths):
    '''將給定路徑中的所有圖像轉換為張量'''
    list_of_tensors = [path_to_tensor(img_path) for img_path in tqdm(img_paths)]
    return np.vstack(list_of_tensors)

最后，我們將使用ImageDataGenerator對圖像進行動態縮放和增強

train_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255,
                                                horizontal_flip=True,
                                                vertical_flip=True,
                                                rotation_range=20)

valid_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255.)

test_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255.)


train_generator = train_datagen.flow(train_tensors, train_targets, batch_size=32)
valid_generator = train_datagen.flow(valid_tensors, valid_targets, batch_size=32)
test_generator = train_datagen.flow(test_tensors, test_targets, batch_size=32)

CNN

我們將在預處理數據集上從頭開始訓練卷積神經網絡（CNN），如下所示：

model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(16, (3,3), activation='relu', input_shape=(224, 224, 3)),
    tf.keras.layers.MaxPooling2D(2, 2),
    tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Conv2D(128, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Conv2D(256, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(2048, activation='softmax'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(1024, activation='softmax'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(133, activation='softmax')
])


model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

checkpointer = tf.keras.callbacks.ModelCheckpoint(filepath='../saved_models/weights_best_custom.hdf5', 
                               verbose=1, save_best_only=True)

model.fit(train_generator, epochs=5, validation_data=valid_generator, callbacks=[checkpointer])

我們使用一個ModelCheckpoint回調來保存基於驗證分數的模型。測試這個模型，我們得到的准確率只有1%左右

使用遷移學習

現在，我們將看到如何使用預訓練的特征可以產生巨大的不同。下載ResNet-50。你可以通過運行下面的代碼單元來提取相應的訓練集、測試和驗證集：

bottleneck_features = np.load('Data/bottleneck_features/DogResnet50Data.npz')
train_Resnet50 = bottleneck_features['train']
valid_Resnet50 = bottleneck_features['valid']
test_Resnet50 = bottleneck_features['test']

我們現在將再次定義模型，並對提取的特征使用GlobalAveragePooling2D，它將一組特征平均為一個值。最后，如果驗證損失在兩個連續的epoch內沒有增加，我們使用額外的回調來降低學習率，降低平台，並且如果驗證損失在連續的5個epoch內沒有增加，也可以提前停止訓練。

Resnet50_model = tf.keras.models.Sequential()
Resnet50_model.add(tf.keras.layers.GlobalAveragePooling2D(input_shape=train_Resnet50.shape[1:]))
Resnet50_model.add(tf.keras.layers.Dense(1024, activation='relu'))
Resnet50_model.add(tf.keras.layers.Dense(133, activation='softmax'))

Resnet50_model.compile(loss='categorical_crossentropy', optimizer='rmsprop', metrics=['accuracy'])

checkpointer = tf.keras.callbacks.ModelCheckpoint(filepath='saved_models/weights_best_Resnet50.hdf5', 
                               verbose=1, save_best_only=True)
early_stopping = tf.keras.callbacks.EarlyStopping(patience=5, monitor='val_loss')

reduce_lr = tf.keras.callbacks.ReduceLROnPlateau(patience=2, monitor='val_loss')
Resnet50_model.fit(train_Resnet50, train_targets, 
          validation_data=(valid_Resnet50, valid_targets),
          epochs=50, batch_size=20, callbacks=[checkpointer, early_stopping, reduce_lr], verbose=1)### 訓練模型

在測試集上的准確率為82.65%。與我們白手起家訓練的模型相比，這是一個巨大的進步。

構建web應用程序

對於web應用程序，我們將首先編寫一個helper函數，該函數接受圖像路徑並返回品種。label_to_cat字典將每個數字標簽映射到它的狗品種。

def predict_breed(img_path):
    '''預測給定圖像的品種'''
    # 提取特征
    bottleneck_feature = extract_Resnet50(path_to_tensor(img_path))
    bottleneck_feature = tf.keras.models.Sequential([
                            tf.keras.layers.GlobalAveragePooling2D(input_shape=bottleneck_feature.shape[1:])
                        ]).predict(bottleneck_feature).reshape(1, 1, 1, 2048)
    # 獲得預測向量
    predicted_vector = Resnet50_model.predict(bottleneck_feature)
    # 模型預測的犬種
    return label_to_cat[np.argmax(predicted_vector)]

對於web應用程序，我們將使用flaskweb框架來幫助我們用最少的代碼創建web應用程序。我們將定義一個接受圖像的路由，並用狗的品種呈現一個輸出模板

@app.route('/upload', methods=['POST','GET'])
def upload_file():
    if request.method == 'GET':
        return render_template('index.html')
    else:
        file = request.files['image']
        full_name = os.path.join(UPLOAD_FOLDER, file.filename)
        file.save(full_name)
        dog_breed = dog_breed_classifier(full_name)
    return render_template('predict.html', image_file_name = file.filename, label = dog_breed)

predict.html是分別顯示圖像及其犬種的模板。

結論

祝賀你！你已經成功地實現了一個狗品種分類器，並且可以自信地分辨出狗的品種。讓我們總結一下我們在這里學到的：

我們對數據集進行了分析和預處理。機器學習算法需要單獨的訓練集、測試集和驗證集來進行置信預測。
我們從零開始使用CNN，由於未能提取特征，所以表現不佳。
然后我們使用遷移學習，准確度大大提高
最后，我們構建了一個Flask web應用程序來准備我們的項目產品

我們確實學到了很多東西，但還有很多其他的事情你可以嘗試。你可以在heroku上部署web應用程序，也可以嘗試使用不同的層（如Dropout層）來提高准確性。

要獲得更多信息和詳細分析，請查看我的GitHub上的代碼：https://github.com/nouman-10/Dog-Breed-Classifier

原文鏈接：https://towardsdatascience.com/dont-know-the-breed-of-your-dog-ml-can-help-6558eb5f7f05

歡迎關注磐創AI博客站：
http://panchuang.net/

sklearn機器學習中文官方文檔：
http://sklearn123.com/

歡迎關注磐創博客資源匯總站：
http://docs.panchuang.net/

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習工程師 - Udacity 項目：實現一個狗品種識別算法App 深度學習實驗項目一貓狗識別深度學習（二）之貓狗分類貓狗識別訓練-遷移學習《python深度學習》筆記---5.3-2、貓狗分類（使用預訓練網絡-實戰）《python深度學習》筆記---5.3-1、貓狗分類（使用預訓練網絡）用深度學習做命名實體識別(五)-模型使用使用tensorflow深度學習識別驗證碼【深度學習】使用MTCNN+FaceNet進行人臉識別 C#中的深度學習（一）：使用OpenCV識別硬幣