機器學習一 -- 什么是監督學習和無監督學習?


機器學習中的監督學習和無監督學習

說在前面

最近的我一直在尋找實習機會,很多公司給了我第一次電話面試的機會,就沒有下文了。不管是HR姐姐還是第一輪的電話面試,公司員工的態度和耐心都很值得點贊,我也非常感激他們。但是我都沒有進入下一輪面試的機會,一路想想我的簡歷和學習經歷,確實也挺難有進入第二輪面試的機會的,因為我大學里學習的知識和技能除了一些常用算法就再也沒別的了,參加過幾場ACM/ICPC並獲得過幾個小獎,沒有什么項目經驗和扎實的語言基礎,可想而知我得弱到什么程度去了。

前幾天還是很認真的想了一下,計划A就是再看看有沒有規模小一些的合口味的公司,如果有機會暑假也可以出去實習一段時間,如果真沒有的話 ,我也不會灰心喪氣,執行我的計划B。我的計划B就是在校再學習一段時間,爭取在校招的時候有個好結果。目前我就決定好好學習一些機器學習和爬蟲的知識,把理論知識搞扎實了,爭取到時候也有勇氣投遞一下搜索方面和算法工程師的職位。

正文

機器學習主要分為有監督學習無監督學習兩種。接下來我詳細的給大家介紹一下這兩種方法的概念和區別。

 

監督學習(supervised learning):通過已有的訓練樣本(即已知數據以及其對應的輸出)來訓練,從而得到一個最優模型,再利用這個模型將所有新的數據樣本映射為相應的輸出結果,對輸出結果進行簡單的判斷從而實現分類的目的,那么這個最優模型也就具有了對未知數據進行分類的能力。在社會中,我們在很小的時候就被大人教授這是鳥啊,那是豬啊,這個是西瓜、南瓜,這個可以吃、那個不能吃啊之類的,我們眼里見到的這些景物食物就是機器學習中的輸入,大人們告訴我們的結果就是輸出,久而久之,當我們見的多了,大人們說的多了,我們腦中就會形成一個抽象的模型,下次在沒有大人提醒的時候看見別墅或者洋樓,我們也能辨別出來這是房子,不能吃,房子本身也不能飛等信息。上學的時候,老師教認字、數學公式啊、英語單詞等等,我們在下次碰到的時候,也能區分開並識別它們。這就是監督學習,它在我們生活中無處不在。

 

無監督學習(unsupervised learning):我們事先沒有任何訓練數據樣本,需要直接對數據進行建模。比如我們去參觀一個畫展,我們對藝術一無所知,但是欣賞完很多幅作品之后,我們面對一幅新的作品之后,至少可以知道這幅作品是什么派別的吧,比如更抽象一些還是更寫實一點,雖然不能很清楚的了解這幅畫的含義,但是至少我們可以把它分為哪一類。再比如我們在電影院看電影,對於之前沒有學過相關電影藝術知識的我們,可能不知道什么是一部好電影,什么是一部不好的電影,可是在觀看了很多部電影之后,我們腦中對電影就有了一個潛在的認識,當我們再次坐在電影院認真觀看新上映的電影時,腦中就會對這部電影產生一個評價:怎么這電影這么不好啊,整個故事線是混亂的,一點也不清晰,比我之前看過的那些電影差遠了,人物的性格也沒有表現出來,關鍵是電影主題還搞偏了;哎呀,這個電影拍得確實好啊,故事情節和人物性格都很鮮明,而且場景很逼真,主角的實力表演加上他與生俱來的憂郁眼神一下把人物演活了。

再給大家舉一個無監督學習的例子。遠古時期,我們的祖先打獵吃肉,他們本身之前是沒有經驗而言的,當有人用很粗的石頭去割動物的皮的時候,發現很難把皮隔開,但是又有人用很薄的石頭去割,發現比別人更加容易的隔開動物的毛皮,於是,第二天、第三天、……,他們就知道了需要尋找比較薄的石頭片來割。這些就是無監督學習的思想,外界沒有經驗和訓練數據樣本提供給它們,完全靠自己摸索。

總結

本次計划比較系統的學習機器學習理論知識了,當然也會比較完整的把我所學到的這些知識分享給大家。回想剛才所提到的監督學習和無監督學習兩種方法,或許很多人都會認為任何事情有人教當然很好了啊,所有監督學習更方便快捷嘛,大部分情況確實這樣,但是如果有些情況比如無法提供訓練數據樣本或者提供訓練數據樣本的成本太高的話,或許我們就應該采取無監督學習的策略了。監督學習的典型例子就是決策樹、神經網絡以及疾病監測,而無監督學習就是很早之前的西洋雙陸棋和聚類。

監督學習和無監督學習的更具體例子我會在后面學習的過程中給大家總結出來。另外,如果大家有比較好的機器學習的資源,也很感謝您的留言。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM