監督學習和非監督學習


一.什么是機器學習:

機器學習的思路:我們可以利用一些訓練數據(已經做過的題),使機器能夠利用它們(解題方法)分析未知數據(考場的題目)。就像考試前老師給我們預測考試會考什么一樣。

簡單的一句話:機器學習就是讓機器從大量的數據集中學習,進而得到一個更加符合現實規律的模型,通過對模型的使用使得機器比以往表現的更好。

 

從字面意思上看,監督學習和非監督學習:變量為’監督’‘’

監督學習

定義:根據已有的數據集,知道輸入和輸出結果之間的關系。根據這種已知的關系,訓練得到一個最優的模型。也就是說,在監督學習中訓練數據既有特征(feature)又有標簽(label),通過訓練,讓機器可以自己找到特征和標簽之間的聯系,在面對只有特征沒有標簽的數據時,可以判斷出標簽。

知道A=1,B=2,C=3,來進行D=?的過程。通過調整參數來讓機器運行在一個范圍內,類似代碼中的循環判斷,假如是一個簡單代碼的話,我先傳入一個字典集,按照ABCD....UVWXYZ的順序,提取它的index,value就可以推出D的值。

如果是一個機器學習的話,先告訴A=1,B=2,C=3,通過找ABC的特征來進行推斷,我認為A=1,B=2,C=3的原因是根據字母的排序,那么我應該告訴機器這個,教他方法然后讓他自己來進行。也就是給他一個方法。

通俗一點,可以把機器學習理解為我們教機器如何做事情。

監督學習的主要分類:回歸(Regression)、分類(Classification)  

回歸問題變量是連續的,例如人口,收入,房子面積等

分類是針對離散型的,輸出的結果是有限的。例如是否,對錯,進退等

也就是知道答案的情況下,給一個模型出來,讓所有的數據都能在這個模型中運算,前提是訓練集具有全面性,或者說是針對某一方面有一定的適應能力。如果訓練集的數據不完善,就需要使用一定的方法,例如引進代價函數的概念等....

監督的理解就是我要看着它,或者說按時檢查它。如果我的訓練模型只有1~500的范圍,但是傳入了一個1000的,那么就需要我來再告訴它遇到1000的時候應該怎么辦,或者說給他設定一個方法,例如x1>500,return 0。這樣的

非監督學習

百科: 現實生活中常常會有這樣的問題:缺乏足夠的先驗知識,因此難以人工標注類別或進行人工類別標注的成本太高。很自然地,我們希望計算機能代我們完成這些工作,或至少提供一些幫助。根據類別未知(沒有被標記)的訓練樣本解決模式識別中的各種問題,稱之為無監督學習。

就是我們不告訴機器怎么去做,不給他方法,給他一個簡單的思路。例如:判斷是不是貓---->我給機器一個最先的底層函數(一個完善的,具有一定CMS基礎的),先讓他把1000個照片分成M份,然后告訴他哪一份是貓,哪一份是你分類錯了。然后我告訴他?????

好像也不行我認為這需要一個循環嵌套的一個系統。

類似這樣吧,一發而動全身。

當這種基礎很完善的時候,也許可以進行非監督學習,我只需要評定結果好不好,讓它自己的參數不停的修改,直到我滿意。

網上的說明:

無監督學習的方法分為兩大類:

(1)    一類為基於概率密度函數估計的直接方法:指設法找到各類別在特征空間的分布參數,再進行分類。

(2)    另一類是稱為基於樣本間相似性度量的簡潔聚類方法:其原理是設法定出不同類別的核心或初始內核,然后依據樣本與核心之間的相似性度量將樣本聚集成不同的類別。

利用聚類結果,可以提取數據集中隱藏信息,對未來數據進行分類和預測。應用於數據挖掘,模式識別,圖像處理等。

    PCA和很多deep learning算法都屬於無監督學習。 

好像說白了就是監督學習底層不夠完善,或者說運用的完善,一個人是沒有手的,我給了一個機械手教它怎么喝水。

無監督學習就是人是完整的人,但是不知道怎么喝水,我只需要做個動作,讓它自己領會。然后給一個評價,OK不OK。直到Ok了為止。

它先通過分類,把一些貓正確的分了出來,然后我說,嗯是對的,那些是錯的,它先提高正確分類那部分的權重值,降低錯誤部分的權重。直到我認可為止。

https://blog.csdn.net/qq_40597317/article/details/80949123中講述了算法的描述。

第一個是簇分配,第二個是移動聚類中心。 那么第二個 移動聚類中心也是基於算法的。還是需要一個完善的人。

http://baijiahao.baidu.com/s?id=1601989883884337751&wfr=spider&for=pc中的表示是:

無監督學習常常被用於數據挖掘,用於在大量無標簽數據中發現些什么。它的訓練數據是無標簽的,訓練目標是能對觀察值進行分類或區分等。例如無監督學習應該能在不給任何額外提示的情況下,僅依據所有“貓”的圖片的特征,將“貓”的圖片從大量的各種各樣的圖片中將區分出來。

無監督學習:

我給機器一個這樣的圖片,它先進行自己的分類,那么我假設它根據:邊數,弧度,角的度這三種分類

按照邊分:就是這樣的

然后按照弧度分:

那么我最后給一個結論,例如我自己內心事先想的就是按照邊來分。那么我告訴他第一張是對的,可以繼續按照這個分,這個就是無監督學習。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM