開始答辯:
我們的項目的方向是基於深度學習的圖像識別。圖像識別可以說是人工智能中相當基礎而又相當有應用前景的一門技術。
計算機的圖像識別技術在公共安全、生物、工業、農業、交通、醫療等很多領域都有應用。
例如交通方面的車牌識別系統;公共安全方面的的人臉識別技術、指紋識別技術;農業方面的種子識別技術、食品品質檢測技術;醫療方面的心電圖識別技術等。隨着計算機技術的不斷發展,圖像識別技術也在不斷的優化,其算法也在不斷改進。
我們團隊利用機器學習中的ResNet模型和現有的cifar10數據庫實現了一個圖像識別系統,經過我們測試,該系統對圖像的准確率高達84%,由於設備的缺乏,使得我們對網絡的改進十分緩慢,也十分吃力,達到這個成績也算是差強人意吧。
下面我將針對網絡模型以及數據集選取這兩個方面進行答辯。
我們使用的網絡模型是2015年由三位華人學者提出的ResNet,該模型相比其他網絡具有以下幾個優點。
引入了深度殘差學習框架,相比於讓一些堆疊層直接學習原始特征,而是讓堆疊層去擬合殘差映射。
ResNet能從增加的深度中獲得准確率的提升,Resnet產生的結果也刷新了當時的記錄。
ResNet擴展性強,當網絡增加到100層甚至1000層的時候,仍然不會出現退化問題。
因此這里我們采用該網絡實現圖像識別技術。
下面我介紹一下cifar10數據集,該數據集是由10個種類的60000個32x32彩色圖像組成,每個類有6000個圖像。有50000個訓練圖像和10000個測試圖像。
該訓練集是由Alex和Ilya整理的一個用於識別普適物體的小型數據集,該訓練集具有普適性 和 實用性。因此我們采取該數據集。
實驗之后我們也得到了較好的訓練結果。
該系統的使用也非常的簡便,將圖片存儲至img文件夾並命名為name.jpg,然后直接運行predict.py程序,就可以得到結果。
該系統是我們團隊的第一個項目,看到結果之后我們欣喜若狂,希望得到大家的認可。
下面用視頻演示一下系統的實測效果。