監督學習:訓練集的每一個數據已經有特征和標簽,即有輸入數據和輸出數據,通過學習訓練集中輸入數據和輸出數據的關系,生成合適的函數將輸入映射到輸出。比如分類、回歸。
無監督學習:訓練集的每一個數據都只有特征,即只有輸入數據,算法需要學習訓練集中的特征關系,進行建模,試圖使類內差距最小、類間差距最大。比如聚類。
半監督學習:訓練集中一部分數據有特征和標簽,另一部分只有特征,綜合兩類數據來生成合適的函數。
區別:
(1)監督學習需要有訓練集和測試集,在訓練集中尋找規律,在測試集中檢驗;而無監督學習只有一堆數據,需要從中尋找某種規律,沒有訓練集沒有檢驗的過程。
(2)監督學習就是識別事物,按照標記好的特征和標簽學習。無監督學習沒有標簽,如果經過學習發現數據集呈現某種聚集性,則可按照數據集現實的聚集性分類,但並不以某些樣本最終和預先標記的標簽相符合作為檢驗,沒有檢驗的過程。
(3)無監督學習是在尋找數據的規律性,這種規律性最終不一定表現為分類數據集,也就是說不一定要“分類”。