有監督學習、無監督學習以及強化學習


定義

 

有監督學習是機器學習任務的一種。它從有標記的訓練數據中推導出預測函數。有標記的訓練數據是指每個訓練實例都包括輸入和期望的輸出。一句話:給定數據,預測標簽

 

無監督學習是機器學習任務的一種。它從無標記的訓練數據中推斷結論。最典型的無監督學習就是聚類分析,它可以在探索性數據分析階段用於發現隱藏的模式或者對數據進行分組。一句話:給定數據,尋找隱藏的結構

 

強化學習是機器學習的另一個領域。它關注的是軟件代理如何在一個環境中采取行動以便最大化某種累積的回報。一句話:給定數據,學習如何選擇一系列行動,以最大化長期收益

 

比喻

 

例如學英語。有監督學習是先讀幾篇中英文對照的文章,從而學會閱讀純英語文章。無監督學習是直接閱讀大量純英文文章,當數量達到一定程度,雖然不能完全理解文章,但也會發現一些詞組的固定搭配,句式等等。

 

舉例

 

  • 有監督學習:學認字

  • 無監督學習:自動聚類

  • 增強學習:學下棋

特點

有監督學習

 

  • 有標簽

  • 直接反饋

  • 預測未來結果

無監督學習

 

  • 無標簽

  • 無反饋

  • 尋找隱藏的結構

強化學習

 

  • 決策流程

  • 激勵系統

  • 學習一系列的行動

在這三大分支中,有監督學習是機器學習中最大和最重要的分支。

 

下一級概念

 

有監督學習

 

  • 分類

  • 回歸

無監督學習

 

  • 聚類

  • 降維

強化學習

 

    • 馬爾可夫決策過程

    • 動態規划


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM