GluonCV是分布式機器學習社區(DMLC)發布的深度學習計算機視覺工具箱,提供了計算機視覺頂級的算法實現與基本運算(另一個是自然語言處理工具箱GluonNLP).
GluonCV簡單易用,有很多訓練好的模型,通過一行代碼就可以下載使用,非常方便.
由於GluonCV是基於MXNet,所以,要先安裝MXNet:
pip install mxnet
然后,再安裝GluonCV:
pip install gluoncv
GluonCV包含了分類、檢測、語義分割等多種計算機視覺應用的模型.下面,以目標檢測Faster-RCNN模型為例,說明怎樣下載並調用GluonCV的模型.
定義網絡:
net = model_zoo.get_model('faster_rcnn_resnet50_v1b_voc', pretrained=True)
其中,'faster_rcnn_resnet50_v1b_voc'為模型名稱,pretrained=True表示使用預訓練的模型,也就是直接下載GluonCV已經訓練好的模型.如果已經下載了,就直接使用,不會再次下載.
定義用到的圖片:
im_fname = ['C:\\Users\\hadoop\\.mxnet\\models\\aa554c60229540cfb4d4999f72134bcb_th.jpg']
對圖片進行處理:
x, orig_img = data.transforms.presets.rcnn.load_test(im_fname)
使用網絡進行推理:
box_ids, scores, bboxes = net(x)
繪制推理結果:
ax = utils.viz.plot_bbox(orig_img, bboxes[0], scores[0], box_ids[0], class_names=net.classes)
plt.show()
運行結果:
更多資料,可以參考https://gluon-cv.mxnet.io/contents.html.