監督學習:簡單來說就是給定一定的訓練樣本(這里一定要注意,樣本是既有數據,也有數據對應的結果),利用這個樣本進行訓練得到一個模型(可以說是一個函數),然后利用這個模型,將所有的輸入映射為相應的輸出,之后對輸出進行簡單的判斷從而達到了分類(或者說回歸)的問題。簡單做一個區分,分類就是離散的數據,回歸就是連續的數據。
非監督學習:同樣,給了樣本,但是這個樣本是只有數據,但是沒有其對應的結果,要求直接對數據進行分析建模。
比如我們去參觀一個畫展,我們完全對藝術一無所知,但是欣賞完多幅作品之后,我們也能把它們分成不同的派別(比如哪些更朦朧一點,哪些更寫實一些,即使我們不知道什么時候叫做朦朧派,什么叫做寫實派,但是至少我們能夠把它們分為兩類)。無監督學習里面典型的例子就是聚類,聚類的目的在於把相似的東西聚在一起,而我們並不關心這一類是什么,因此,一個聚類算法通常只需要知道如何計算相似度就可以開始工作了。
“再比如,買房的時候,給了房屋面積以及其對應的價格,進行分析,這個就叫做監督學習;但是給了面積,沒有給價格,就叫做非監督學習。監督,意味着給了一個標准作為'監督' (或者理解為限制)。就是說建模之后是有一個標准用來衡量你的對與錯;非監督就是沒有這個標准,對數據進行聚類之后,並沒有一個標准進行對其的衡量。”