1.監督學習
監督學習是指:利用一組已知類別的樣本調整分類器的參數,使其達到所要求性能的過程,也稱為監督訓練或有教師學習。
輸入數據為“訓練數據”,由正確的訓練集和錯誤的訓練集構成。
2.非監督學習
在機器學習,無監督學習的問題是,在未加標簽的數據中,試圖找到隱藏的結構。因為提供給學習者的實例是未標記的,因此沒有錯誤或報酬信號來評估潛在的解決方案。
沒有告訴模型哪些是正確的,哪些是錯誤的。
關聯規則,聚類
3.強化學習
目標:學習從環境狀態到行為的映射,使得智能體選擇的行為能夠獲得環境最大的獎賞,使得外部環境對學習系統在某種意義下的評價(或整個系統的運行性能)為最佳。
如果Agent的某個行為策略導致環境正的獎賞(強化信號),那么Agent以后產生這個行為策略的趨勢便會加強。Agent的目標是在每個離散狀態發現最優策略以使期望的折扣獎賞和最大。
4.人工神經網絡和深度學習都屬於機器學習的一種。深度學習是神經網絡的分支,深度學習的基本結構是深度神經網絡。
5.傳統神經網絡一般只有2-3層,深度神經網絡至少有5層。
6.如何訓練神經網絡:
BP算法:BP算法是由學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成。由於多層前饋網絡的訓練經常采用誤差反向傳播算法,人們也常把將多層前饋網絡直接稱為BP網絡。
1)使用自下上升非監督學習(就是從底層開始,一層一層的往頂層訓練):
采用無標定數據(有標定數據也可)分層訓練各層參數,這一步可以看作是一個無監督訓練過程,是和傳統神經網絡區別最大的部分(這個過程可以看作是feature learning過程):
具體的,先用無標定數據訓練第一層,訓練時先學習第一層的參數(這一層可以看作是得到一個使得輸出和輸入差別最小的三層神經網絡的隱層),由於模型capacity的限制以及稀疏性約束,使得得到的模型能夠學習到數據本身的結構,從而得到比輸入更具有表示能力的特征;在學習得到第n-1層后,將n-1層的輸出作為第n層的輸入,訓練第n層,由此分別得到各層的參數;
2)自頂向下的監督學習(就是通過帶標簽的數據去訓練,誤差自頂向下傳輸,對網絡進行微調):
基於第一步得到的各層參數進一步fine-tune整個多層模型的參數,這一步是一個有監督訓練過程;第一步類似神經網絡的隨機初始化初值過程,由於DL的第一步不是隨機初始化,而是通過學習輸入數據的結構得到的,因而這個初值更接近全局最優,從而能夠取得更好的效果;所以deep learning效果好很大程度上歸功於第一步的feature learning過程。