機器學習001 deeplearning.ai 深度學習課程 Neural Networks and Deep Learning 第一周總結


Deep Learning Specialization

吳恩達老師最近在coursera上聯合deeplearning.ai 推出了有關深度學習的一系列課程,相對於之前的machine learning課程,這次的課程更加實用,作業語言也有matlab改為了python從而更加貼合目前的趨勢。在此將對這個系列課程做一個學習筆記。

而這次的Deep Learning Specialization分為五門課程,分別為:Neural Networks and Deep Learning,Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization,Structuring Machine Learning Projects,Convolutional Neural Networks,Sequence Models。

這篇隨筆首先從第一門課Neural Networks and Deep Learning的第一周開始

深度學習簡介

學習目標:

1. 了解推動深度學習的主要趨勢

2. 能夠解釋深度學習是如何應用到監督學習中的

3. 了解深度學習模型的主要類別以及什么時候該應用什么模型

4. 能夠簡單了解什么情況下機器學習會工作的比較順利

 

主要內容

人工智能將會像電力的出現一樣給人類社會帶來又一次巨大轉變。就想一百年前一樣,人工智能也在改變着許多行業。

 

什么是神經網絡

假設我們用房屋的面積大小來預測一個房屋的價格,那么我們可以用線性回歸(linear regression)來進行擬合,同時我們知道房屋的價格不會是個負值,因此我們可以用下圖中的藍線來進行一個擬合。

 

這個藍線很類似於目前神經網絡中常用的激活函數ReLU(rectified linear unit)。對於這種只有一個輸入和一個輸出的問題,我們可以用一個最簡單的神經網絡來表示。

 

 

這種最簡單的神經網絡就好像樂高積木一樣,更加復雜的網絡都可以用這個最簡單的“樂高”塊拼接而成。

當然在日常生活中我們可能面臨更加復雜的問題。決定一個房屋價格的因素除了房屋大小以外,可能還有卧室的數量,郵政編碼(也就是房子的所在街道)以及周邊社區的富裕情況。房屋大小和卧室數量可以決定這個房屋適合幾口之家,而房屋所在街道可能決定了交通是否便利,房子所在的街道和周邊社區的富裕程度還可能決定這個房子是不是學區房。之后再由的房屋適合幾口之家,交通是否便利,是否是學區房來預測這個房屋的價格。當我們用神經網絡解決此類問題時,我們只需給出輸入X也就是房屋大小,卧室數,郵編和周邊的富裕情況就可以通過一個訓練好的神經網絡得到一個預測的房屋價格。

 

 

從這個神經網絡示意圖我們可以看出,輸入層每個特征都和隱層的每個神經元相連。當然,連接的權重可能會有所不同。

使用神經網絡進行監督學習

監督學習中,我們一定會有成對的輸入x和輸出y。而監督學習目前有着很廣泛的應用。在不同應用中,我們應當選擇適合的輸入和輸出

 


在不同的應用領域,我們可能采取不同的深度學習模型。比如在不動產(real estate)和在線廣告(online advertising)中,我們更傾向於使用標准的神經網絡(standard NN)。而在標記圖片或者進行圖像識別時,我們經常使用卷積神經網絡(CNN, convolutional neural network)。在進行語音識別、翻譯等序列識別的時候,常用的模型為循環神經網絡(RNN, recurrent neural network)。當面對自動駕駛等復雜問題時,我們可能會使用復雜混合網絡(complex hybrid neural network architecture.)。

 

 

在監督學習中,我們可能面對兩種數據:結構化數據和非結構化數據。對於結構化數據來說,對於每個特征都有明確界定的含義。而非結構化數據比如聲音、圖像和文本等,特征可能是單個音節或者像素,沒有明確的意義。

什么促使深度學習騰飛

  1. 深度學習在很多領域的應用中取得了巨大的成功,比如在線廣告推薦,語音識別和圖像識別等。
  2. 目前計算機的計算能力相對於過去有了很大提高
  3. 我們現在有了很多數據(大數據)

 

 

從這個圖中我們可以看出,更多的數據,規模更大的網絡都可以提高神經網絡的表現。同時算法的發展也是不容忽略的。比如從過去常用的sigmoid激活函數到目前常用的ReLU激活函數。同時新的算法一般都使得神經網絡的訓練速度更快。更快的訓練速度可以讓我們有機會訓練更大的網絡來應付越來越多的數據,同時也可以讓我們嘗試更多的想法,可以更快地測試不同的參數。同時硬件的發展也讓我們可以更快的訓練網絡模型來驗證想法。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM