機器學習分為:監督學習,無監督學習,半監督學習(也可以用hinton所說的強化學習)等。
監督與無監督區別:
1. 有監督學習方法必須要有訓練集與測試樣本。在訓練集中找規律,而對測試樣本使用這種規律。而非監督學習沒有訓練集,只有一組數據,在該組數據集內尋找規律。
2. 有監督學習的方法就是識別事物,識別的結果表現在給待識別數據加上了標簽。因此訓練樣本集必須由帶標簽的樣本組成。而非監督學習方法只有要分析的數據集的本身,預先沒有什么標簽。如果發現數據集呈現某種聚集性,則可按自然的聚集性分類,但不予以某種預先分類標簽對上號為目的。
3. 非監督學習方法在尋找數據集中的規律性,這種規律性並不一定要達到划分數據集的目的,也就是說不一定要“分類”。
這一點是比有監督學習方法的用途要廣。 譬如分析一堆數據的主分量,或分析數據集有什么特點都可以歸於非監督學習方法的范疇。
4. 用非監督學習方法分析數據集的主分量與用K-L變換計算數據集的主分量又有區別。后者從方法上講不是學習方法。因此用K-L變換找主分量不屬於無監督學習方法,即方法上不是。而通過學習逐漸找到規律性這體現了學習方法這一點。在人工神經元網絡中尋找主分量的方法屬於無監督學習方法。
何時采用對應方法:
簡單的方法就是從定義入手,有訓練樣本則考慮采用監督學習方法;無訓練樣本,則一定不能用監督學習方法。但是,現實問題中,即使沒有訓練樣本,我們也能夠憑借自己的雙眼,從待分類的數據中,人工標注一些樣本,並把它們作為訓練樣本,這樣的話,可以把條件改善,用監督學習方法來做。對於不同的場景,正負樣本的分布如果會存在偏移(可能大的偏移,可能比較小),這樣的話,監督學習的效果可能就不如用非監督學習了。