一、人工智能--在機器實現智能
人工智能(Artificial intelligence)簡稱AI。是一門研究如何構造智能機器(智能計算機)或智能系統,使它能模擬、延伸、擴展人類智能的計算機學科。通俗的來說,人工智能就是要研究如何使機器具有能聽、能說、能看、會寫、能思考、會學習、能適應環境變化、能解決面臨的各種實際問題等功能的一門學科。人工智能即是用人工的方法在機器(計算機)上實現的智能。
人工智能研究的基本內容主要有:知識表示、機器感知、機器思維、機器學習、機器行為這五方面。主要研究領域主要有:自動定理證明、博弈、模式識別機器視覺、自然語言理解、智能信息檢索、數據挖掘與知識發現、專家系統、自動程序設計、機器人、組合優化問題、人工神經網絡、分布式人工智能與多智能體、智能控制、智能仿真、智能計算機系統、智能通訊、智能網絡系統和人工生命等。
人工智能目前分為弱人工智能和強人工智能和超人工智能。
(1)弱人工智能:弱人工智能(ArtificialNarrow Intelligence /ANI),只專注於完成某個特定的任務,例如語音識別、圖象識別和翻譯等,是擅長於單個方面的人工智能。它們只是用於解決特定的具體類的任務問題而存在,大都是統計數據,以此從中歸納出模型。由於弱人工智能智能處理較為單一的問題,且發展程度並沒有達到模擬人腦思維的程度,所以弱人工智能仍然屬於“工具”的范疇,與傳統的“產品”在本質上並無區別。
(2) 強人工智能:強人工智能(Artificial Generallnteligence /AGI),屬於人類級別的人工智能,在各方面都能和人類比肩,它能夠進行思考、計划、解決問題、抽象思維、理解復雜理念、快速學習和從經驗中學習等操作,並且和人類一樣得心應手。
(3)超人工智能:超人工智能(Artificial Superintelligence/ASI),在幾乎所有領域都比最聰明的人類大腦都聰明許多,包括科學創新、通識和社交技能。在超人工智能階段,人工智能已經跨過“奇點”,其計算和思維能力已經遠超人腦。此時的人工智能已經不是人類可以理解和想象。人工智能將打破人腦受到的維度限制,其所觀察和思考的內容,人腦已經無法理解,人工智能將形成一個新的社會。
目前我們仍處於弱人工智能階段。
二、機器學習--一種人工智能方法
機器學習(MachineLearning)簡稱ML,就是研究如何使計算機具有類似於人的學習能力,使它能通過學習自動地獲取知識。機器學習是一個難度較大的研究領域,屬於人工智能的一個分支,也是人工智能的和核心,它與腦科學、神經心理學、計算機視覺、計算機聽覺等都有密切的聯系,依賴於這些學科的共同發展。
機器學習是一種通過利用數據,訓練出模型,然后使用模型預測的一種方法。機器學習方法主要有:
(1)有監督學習(Supeervised Learning),從給定的有標注的訓練集中學習出一個函數(模型參數),當新的數據到來時可以根據這個函數預測結果。常見的任務包括分類和回歸。
(2)無監督學習(Unsupervised Learning),沒有標注的訓練數據集,需要根據樣本間的統計規律對樣本進行分析。常見任務聚類。
(3)半監督學習(Semi-supervised Learning),結合(少量的)標注訓練數據和(大量的)未標注數據來進行數據的分類學習。它存在聚類假設(整體)和流形假設(局部)這兩個基本假設。
(4)增強學習(Reinforcement Learning),外部環境對輸出只給出評價信息而非正確答案,學習機通過強化受獎勵的動作來改善自身的性能。
(5)多任務學習(Multi-task Learning),把多個相關(related)的任務放在一起同時學習。
機器學習的一般過程有:
一、數據預處理(數據清洗、數據集成、數據采樣)。
二、特征工程(特征編碼、特征選擇、特征降維、規范化)。
三、數據建模(回歸問題、分類問題、聚類問題、其他問題)。
四、結果評估(擬合度量、查准率、查全率、F1值、PR曲線、ROC曲線)。
我們一般說的機器學習方法就是指在數學建模中所用的方法,主要有:
(1)分類問題。主要方法有決策樹分類、貝葉斯分類、支持向量機、邏輯回歸和集成學習。
(2)回歸問題。主要方法有線性回歸、嶺回歸和Lasso回歸。
(3)聚類問題。主要方法有K-means、高斯混合聚類、密度聚類、層次聚類和譜聚類。
(4)其他問題。主要方法有隱馬爾可夫模型、LDA主題模型、條件隨機場、神經網絡和深度學習。
三、深度學習--一種實現機器學習的技術
深度學習(DeepLearning)簡稱DL。它是機器學習(ML, Machine Learning)領域中一個新的研究方向,它被引入機器學習使其更接近於最初的目標——人工智能(AI, Artificial Intelligence)。最初的深度學習是利用深度神經網絡來解決特征表達的一種學習過程。深度神經網絡本身並不是一個全新的概念,可大致理解為包含多個隱含層的神經網絡結構。為了提高深層神經網絡的訓練效果,人們對神經元的連接方法和激活函數等方面做出相應的調整。深度學習是機器學習研究中的一個新的領域,其動機在於建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據,如圖象、聲音、文本。
深度學習是學習樣本數據的內在規律和表示層次,這些學習過程中獲得的信息對諸如文字,圖象和聲音等數據的解釋有很大的幫助。它的最終目標是讓機器能夠像人一樣具有分析學習能力,能夠識別文字、圖像和聲音等數據。 深度學習是一個復雜的機器學習算法,在語音和圖像識別方面取得的效果,遠遠超過先前相關技術。深度學習使機器模仿視聽和思考等人類的活動,解決了很多復雜的模式識別難題,使得人工智能相關技術取得了很大進步。
深度學習是一類模式分析方法的統稱,就具體研究內容而言,主要涉及三類方法:
(1)基於卷積運算的神經網絡系統,即卷積神經網絡(CNN)。
(2)基於多層神經元的自編碼神經網絡,包括自編碼( Auto encoder)和稀疏編碼( Sparse Coding)兩類。
(3)以多層自編碼神經網絡的方式進行預訓練,進而結合鑒別信息進一步優化神經網絡權值的深度置信網絡(DBN)。
深度學習主要應用並取得成果的領域:
(1)搜索技術
(2)數據挖掘
(3)機器學習
(4)計算機視覺
(5)機器翻譯
(6)自然語言處理、語音識別
(7)推薦和個性化技術
(8)無人駕駛等
四、區別與聯系
深度學習是機器學習的一種,而機器學習是實現人工智能的必經路徑。 關系如下圖:
圖片來源於網絡