0、以作者的書籍開篇之語開始:
“The secret of getting ahead is to get started.” – Mark Twain
本書指導深度學習應用到實踐、真實的計算機視覺問題中,利用python語言和keras+mxnet庫。
1、全書分為三卷:
第一卷:Starter Bundle:
對於首次接觸將深度學習應用到圖像識別理論的人來是是至關重要的。
在這里將學習到:
(1)機器學習
(2)深度學習
(3)CNN網絡
(4)怎樣從自定義的數據集開始項目工作。
第二卷:Practitioner Bundle
這一卷在第一卷基礎上,對於更進一步學習深度學習、理解高級技術、並且發現最佳的實踐和經驗規則的人來說,是非常適合的。
第三卷:ImageNet Bundle
這一卷是用於計算機視覺的完整深度學習經驗。在這一卷中,我演示了如何在海量圖像集數據集上訓練大型神經網絡以及解決現實世界的案例研究,包括年齡+性別預測、汽車制造+模型識別、面部表情識別、等等。
2、python、Keras、mxnet介紹
書中所有示例都用python語言。
主要的深度學習庫使用Keras。Keras是一種深度學習庫,而TensorFlow和theano作為計算引擎來使用,物盡其用,各司其職。
第二種深度學習庫使用mxnet,僅在ImageNet Bundle卷中使用。
最后,我們將使用較少的計算機視覺、圖像處理和機器學習庫,如opencv、scikit-image、scikit-learn等等。
3、開發自己的深度學習工具集
學習本書的一大動力是,利用現有的深度學習庫,開發一套自己的基於python的工具集,能夠讓我們訓練自己的深度學習網絡。
在學習完該書之后,我們的工具集將具備的功能:
(1)從磁盤加載數據集、存儲到內存中、或者將它們寫入優化的數據庫格式中。
(2)預處理圖像,使它能夠適合於CNN的訓練。
(3)創建一個藍圖類,使它能夠應用於我們自定義的CNNs的應用。
(4)手動實現流行的CNN架構,如AlexNet、VGGNet、GoogLeNet、ResNet和SqueezeNet(且從零開始訓練它們)。
(5)更多,可見該書內容。
4、總結:
我們生活在機器學習、神經網絡和深度學習的歷史時刻。
不要錯過歷史上的這一時刻——你不僅應該成為深度學習的一部分,而且那些過早投資的人肯定會從他們所投入的時間、資源和創造力中獲得巨大的回報。
下面盡情享受這本書吧。
5、附加說明:
除了書籍之外的資源以及運行環境配置,見http://pyimg.co/fnkxk
這幾卷文章更新:如若需要更新,進入網站http://www.pyimagesearch.com/contact/