監督學習:通過人為地輸入帶有標簽的訓練數據集,使計算機訓練得到一個較為合適的模型,對未知標簽的數據進行預測。常見的監督學習算法:回歸和分類。
1.回歸(Regression):通常有兩個及以上變量,數據一般是連續的,通過訓練集變量之間的關系得到一條模擬訓練樣本的曲線,對未知數據的因變量進行預測,其中包括線性回歸和非線性回歸。如房價與面積的問題,就是線性回歸。
2.分類(Classfication): 通常用於預測某件事發生的概率,也是輸入帶有標簽的訓練集,數據一般是離散的,比如推測某人是否患有肺癌,通過樣本訓練,可以得到自變量(如是否有吸煙史,是否生活在霧霾地區)的權重,根據該權值可以根據危險因素預測他患肺癌的可能性。
非監督學習:由於在許多實際應用中,事先並不知道產生的數據的類別,也沒有訓練樣本對應的類別,所以要從這些沒有被標記的數據集學習分類器設計,通過數據之間的內在聯系和相似性將他們分成若干類。非監督學習的方法主要有以下兩類。
1.基於概率密度函數估計的直接方法:通過分解各個類別的概率密度函數,再將每個類別划分到特征空間,用貝葉斯決策方法設計分類器。
2.基於樣本間相似度間接聚類方法:其中非迭代的分級聚類算法——把每一個樣本都看成一個類別,給定兩個樣本相似度的計算方法,計算兩個樣本的相似度,把相似度最大的類進行合並,在計算新的類與類之間的相似度,直到把相似的所有樣本合為一個類為止。