淺析對人工智能,機器學習和深度學習的理解


  我們對於“人工智能”這個術語都很熟悉。畢竟,它是《終結者》,《黑客帝國》和《機械姬》等美國大片電影中非常流行的關鍵詞。但你最近或許也聽說過其他術語,像“機器學習”和“深度學習”,有時這兩個術語會和“人工智能”互相替換使用,前年早些時候,Google DeepMind的AlphaGo打敗了韓國的圍棋大師李世乭九段。在媒體描述DeepMind勝利的時候,將人工智能(AI)、機器學習(machine learning)和深度學習(deep learning)都用上了。這三者在AlphaGo擊敗李世乭的過程中都起了作用,但它們說的並不是一回事。那么這三個名詞之間有什么區別?

   我會先解釋一下人工智能(AI)、機器學習(ML)和深度學習(DL),以及它們有怎樣的區別。

1 三者的概念

  人工智能(英語:Artificial Intelligence, AI):是指由人工制造出來的系統所表現出來的智能。通常人工智能是指通過普通電腦實現的智能。人工智能的研究可以分為幾個技術問題。其分支領域主要集中在解決具體問題,其中之一是,如何使用各種不同的工具完成特定的應用程序。AI的核心問題包括推理、知識、規划、學習、交流、感知、移動和操作物體的能力等。

  目前有大量的工具應用了人工智能,其中包括搜索和數學優化、邏輯推演。而基於仿生學、認知心理學,以及基於概率論和經濟學的算法等等也在逐步探索當中。

  機器學習(英語:Machine Learning):是人工智能的一個分支。人工智能的研究是從以“推理”為重點到以“知識”為重點,再到以“學習”為重點,一條自然、清晰的脈絡。顯然,機器學習是實現人工智能的一個途徑,即以機器學習為手段解決人工智能中的問題。機器學習在近30多年已發展為一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算復雜性理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的算法。機器學習算法是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的算法。因為學習算法中涉及了大量的統計學理論,機器學習與推斷統計學聯系尤為密切,也被稱為統計學習理論。算法設計方面,機器學習理論關注可以實現的,行之有效的學習算法。很多推論問題屬於無程序可循難度,所以部分的機器學習研究是開發容易處理的近似算法。

  機器學習有下面幾種定義:

    機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是
如何在經驗學習中改善具體算法的性能。

    機器學習是對能通過經驗自動改進的計算機算法的研究。

    機器學習是用數據或以往的經驗,以此優化計算機程序的性能標准。

  

  機器學習已廣泛應用於數據挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略游戲和機器人等領域。

  機器學習最成功的應用領域是計算機視覺,雖然也還是需要大量的手工編碼來完成工作。人們需要手工編寫分類器、邊緣檢測濾波器,以便讓程序能識別物體從哪里開始,到哪里結束;寫形狀檢測程序來判斷檢測對象是不是有八條邊;寫分類器來識別字母“ST-O-P”。使用以上這些手工編寫的分類器,人們總算可以開發算法來感知圖像,判斷圖像是不是一個停止標志牌。

  深度學習(英語:Deep Learning):是機器學習拉出的分支,它試圖使用包含復雜結構或由多重非線性變換構成的多個處理層對數據進行高層抽象的算法。

  深度學習是機器學習中一種基於對數據進行表征學習的方法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更容易從實例中學習任務(例如,人臉識別或面部表情識別)。深度學習的好處是用非監督式或半監督式的特征學習和分層特征提取高效算法來替代手工獲取特征。

 

    統計學習:關於計算機基於數據構建概率統計模型,並運用模型對數據進行預測與分析的一門學科。

    機器學習:致力於研究如何通過計算的手段,利用經驗來改善系統自身的性能。

    深度學習:機器學習中的神經網絡算法的延伸,可以理解為包含很多個隱層的神經網絡模型。

 

2  三者的區別

人工智能:人工智能是人類社會發展主要目標

機器學習:機器學習是實現人工智能的核心技術

深度學習:是機器學習中最熱門的算法

  1956年,約翰·麥卡錫成為了第一位創造了人工智能機器的人。他制造的機器具備足夠高的能力,得以執行類似人類智力水平的任務,包括:做出規划、理解語言、識別對象和聲音、學習並解決問題等。

   對於人工智能,我們可以從廣義和狹義兩個層面來理解。廣義層面來講,AI應該具備人類智力的所有特征,包括上述的能力。狹義層面的人工智能則只具備部分人類智力某些方面的能力,並且能在這些領域內做的非常出眾,但可能缺乏其他領域的能力。比如說,一個人工智能機器可能擁有強大的圖像識別功能,但除此之外並無他用,這就是狹義層面AI的例子。

   從核心上來說,機器學習是實現人工智能的一種途徑。

  1959年,Arthur Samuel在AI之后創造了“機器學習”這個短語,並將其定義為“在沒有被明確編程的情況下就能學習的能力。”當然,你可以不使用機器學習的方式來實現人工智能,不過這需要你運用復雜的規則和決策樹,再敲下幾百萬行的代碼才行。

   實際上,機器學習是一種“訓練”算法的方式,目的是使機器能夠向算法傳送大量的數據,並允許算法進行自我調整和改進,而不是利用具有特定指令的編碼軟件例程來完成指定的任務。

   舉個例子,機器學習已經被用於計算機視覺(機器具備識別圖像或視頻中的對象的能力)方面,並已經有了顯著的進步。你可以收集數十萬甚至數百萬張圖片,然后讓人標記它們。例如,讓人標記出其中含有貓的圖片。對於算法,它也能夠嘗試建立一個模型,可以像人一樣准確地標記出含有貓的圖片。一旦精度水平足夠高,機器就相當於“掌握”了貓的樣子。

  深度學習是機器學習的眾多方法之一。其他方法包括決策樹學習、歸納邏輯編程、聚類、強化學習和貝葉斯網絡等。

   深度學習的靈感來自大腦的結構和功能,即許多神經元的互連。人工神經網絡(ANN)是模擬大腦生物結構的算法。

   在ANN中,存在具有離散層和與其他“神經元”連接的“神經元”。每個圖層挑選出一個要學習的特征,如圖像識別中的曲線/邊緣。 正是這種分層賦予了“深度學習”這樣的名字,深度就是通過使用多層創建的,而不是單層。

3  深度學習,給人工智能以璀璨的未來

  深度學習使得機器學習能夠實現眾多的應用,並拓展了人工智能的領域范圍。深度學習摧枯拉朽般地實現了各種任務,使得似乎所有的機器輔助功能都變為可能。無人駕駛汽車,預防性醫療保健,甚至是更好的電影推薦,都近在眼前,或者即將實現。

3.1 現在說的很火的深度學習是什么呢?

  1. 深度學習是機器學習中神經網絡算法的延伸,只不過應用的比較廣
  2. 深度學習在計算機視覺和自然語言處理中更厲害一些
  3. 有些人問到底是學習機器學習還是深度學習?其實一切的基礎都是機器學習,做任何事情沒有堅實的基礎只會越來越迷茫,機器學習值得我們從頭開始

4   如何學好機器學習?

4.1 機器學習我該怎么學?

  1. 機器學習本質包含了數學原理推導與實際應用技巧
  2. 機器學習中有很多經典算法,既然要學習,那就需要清楚一個算法是怎么來的(推導)以及該如何應用
  3. 機器學習中,數學非常重要,大學的數學基礎即可,如果都忘了,那么就邊學邊查,哪里不會學哪里就OK
  4. 數學推導一定要會,我們不光要知其然還要知其所以然,這對於我們的應用具有很大的幫助

4.2  機器學習可以分為下面幾種類別

  • 監督學習從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出,也可以說是特征和目標。訓練數據中的目標是由人標注的。常見的監督學習算法包括回歸分析和統計分類。

  • 無監督學習與監督學習相比,訓練集沒有人為標注的結果。常見的無監督學習算法有聚類。

  • 半監督學習介於監督學習與無監督學習之間。它主要考慮如何利用少量的標注樣本和大量的未標注樣本進行訓練和分類的問題。。

  • 增強學習通過觀察來學習做成如何的動作。每個動作都會對環境有所影響,學習對象根據觀察到的周圍環境的反饋來做出判斷。

  在傳統的機器學習領域,監督學習最大的問題是訓練數據標注成本比較高,而無監督學習應用范圍有限。利用少量的訓練樣本和大量無標注數據的半監督學習一直是機器學習的研究重點。

  當前非常流行的深度學習GAN模型和半監督學習的思路有相通之處,GAN是“生成對抗網絡”(Generative Adversarial Networks)的簡稱,包括了一個生成模型G和一個判別模型D,GAN的目標函數是關於D與G的一個零和游戲,也是一個最小-最大化問題。

   GAN實際上就是生成模型和判別模型之間的一個模仿游戲。生成模型的目的,就是要盡量去模仿、建模和學習真實數據的分布規律;而判別模型則是要判別自己所得到的一個輸入數據,究竟是來自於真實的數據分布還是來自於一個生成模型。通過這兩個內部模型之間不斷的競爭,從而提高兩個模型的生成能力和判別能力。

  所以我們就安心學習好機器學習就好,那么如何學習好機器學習呢,下面用幾張圖片展示!

 

  圖片總結的如此清晰,我就不重復說了(此圖片來此天善智能某課堂的PPT)

5  機器學習知識結構

  小編從學習機器學習需要的各個方面在此闡述了要想學習機器學習,首先需要學習或者說准備什么東西,從以下四個方面說起。

5.1 數學基礎

  大學專業不是數學的同志們需要惡補的知識科目如下:

微積分  線性代數  矩陣論  凸優化  離散數學

概率論  統計學  隨機過程

  

 

5.2   機器學習理論

  機器學習的理論知識如下,其中推薦的包括算法和學習模型,還有訓練的網址,全是干貨哦,當然還是不全,以后小編了解到會逐漸加上的。

    有監督機器學習模型和算法:分類和回歸  線性回歸 感知機器學習 
決策樹 朴素貝葉斯 人工神經網絡,邏輯回歸,隨機森林,GBDT lightgbm xgboost....

  

 

5.3  編程與開發

  編程開發使用的主要是python語言和Linux服務器,加上TensorFlow

python:numpy pandas matplotlib seaborn  sklearn 

Linux : java c Spark Hadoop  SQL  excel..

  

 

 

5.4 英文能力

熟練地英語閱讀能力

  

6  以下文章將會有助於你更加深入了解人工智能、機器學習、深度學習:

   小編文中許多知識點都是參考下面的文章,大家有興趣的可以繼續了解三者的區別。

1、Artificial Intelligence, Machine Learning, and Deep Learning

2、Why Deep Learning is Radically Different from Machine Learning

3、一篇文章講清楚人工智能、機器學習和深度學習的區別

4、人工智能,機器學習和深度學習有什么區別?

5、如何區分人工智能、機器學習和深度學習?

6、WHY DEEP LEARNING IS SUDDENLY CHANGING YOUR LIFE

7、The Current State of Machine Intelligence 3.0

8、Here are 50 Companies Leading the AI Revolution

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM