了解什么是機器學習


機器學習

定義

機器學習是專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。
還有其他幾種定義:
(1)機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能。
(2)機器學習是對能通過經驗自動改進的計算機算法的研究。
(3)機器學習是用數據或以往的經驗,以此優化計算機程序的性能標准。

研究現狀

機器學習的研究主要分為兩類研究方向:
1、傳統機器學習的研究,該類研究主要是研究學習機制,注重探索模擬人的學習機制
2、大數據環境下機器學習的研究,該類研究主要是研究如何有效利用信息,注重從巨量數據中獲取隱藏的、有效的、可理解的知識

機器學習的分類

我們從不同的角度進行分類。
基於學習策略的分類。
1、模擬人腦的機器學習

  • 符號學習
  • 神經網絡學習(連接學習)

2、直接采用數學方法的機器學習
主要是統計機器學習。
統計機器學習是基於對數據的初步認識以及學習目的的分析,選擇合適的數學模型,擬定超參數,並輸入樣本數據,依據一定的策略,運用合適的學習算法對模型進行訓練,最后運用訓練好的模型對數據進行分析預測。

統計機器學習三個要素:
模型(model):模型在未進行訓練前,其可能的參數是多個甚至無窮的,故可能的模型也是多個甚至無窮的,這些模型構成的集合就是假設空間。
策略(strategy):即從假設空間中挑選出參數最優的模型的准則。模型的分類或預測結果與實際情況的誤差(損失函數)越小,模型就越好。那么策略就是誤差最小。
算法(algorithm):即從假設空間中挑選模型的方法(等同於求解最佳的模型參數)。機器學習的參數求解通常都會轉化為最優化問題,故學習算法通常是最優化算法,例如最速梯度下降法、牛頓法以及擬牛頓法等。

基於學習方法的分類
1、歸納學習

  • 符號歸納學習
  • 函數歸納學習

2、演繹學習
3、類比學習
4、分析學習

基於學習方式的分類
1、監督學習
2、無監督學習
3、強化學習

基於數據形式的分類
1、結構化學習
2、非結構化學習

基於學習目標的分類
1、概念學習
2、規則學習
3、函數學習
4、類別學習
5、貝葉斯網絡學習

常見算法

決策樹算法
朴素貝葉斯算法
支持向量機算法
隨機森林算法
人工神經網絡算法
Boosting與Bagging算法
關聯規則算法
EM(期望最大化)算法
深度學習


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM