參考網址:https://www.jianshu.com/p/9b2826ef8a28
1、有監督學習:通過已有的訓練樣本去訓練得到一個最優模型,再利用這個模型將所有的輸入映射為相應的輸出,對輸出進行簡單的判斷從而實現預測和分類的目的,也就具有了對未知數據進行預測和分類的能力。就如有標准答案的練習題,然后再去考試,相比沒有答案的練習題然后去考試准確率更高。又如我們小的時候不知道牛和鳥是否屬於一類,但當我們隨着長大各種知識不斷輸入,我們腦中的模型越來越准確,判斷動物也越來越准確。
有監督學習可分為回歸和分類。
回歸:即給出一堆自變量X和因變量Y,擬合出一個函數,這些自變量X就是特征向量,因變量Y就是標簽。 而且標簽的值連續的,例LR。
分類:其數據集,由特征向量X和它們的標簽Y組成,當你利用數據訓練出模型后,給你一個只知道特征向量不知道標簽的數據,讓你求它的標簽是哪一個?其輸出結果是離散的。例如logistics、SVM、KNN等。
2、無監督學習:我們事先沒有任何訓練樣本,而需要直接對數據進行建模。比如我們去參觀一個畫展,我們完全對藝術一無所知,但是欣賞完多幅作品之后,我們也能把它們分成不同的派別。無監督學習主要算法是聚類,聚類目的在於把相似的東西聚在一起,主要通過計算樣本間和群體間距離得到,主要算法包括Kmeans、層次聚類、EM算法。
作者:數據分析之路
鏈接:https://www.jianshu.com/p/9b2826ef8a28
來源:簡書
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。