人工智能
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。
人工智能是對人的意識、思維的信息過程的模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。
機器學習
1. 什么是機器學習
根據等人事件中判斷人是否遲到了解什么是機器學習,具體參見地址:http://www.cnblogs.com/hellochennan/p/5423740.html
機器學習方法是計算機利用已有的數據(經驗),得出了某種模型(遲到的規律),並利用此模型預測未來(是否遲到)的一種方法。
機器學習與人類思考的經驗過程是類似的,不過它能考慮更多的情況,執行更加復雜的計算。事實上,機器學習的一個主要目的就是把人類思考歸納經驗的過程轉化為計算機通過對數據的處理計算得出模型的過程。經過計算機得出的模型能夠以近似於人的方式解決很多靈活復雜的問題。
2.機器學習定義
從廣義上來說,機器學習是一種能夠賦予機器學習的能力以此讓它完成直接編程無法完成的功能的方法。但從實踐的意義上來說,機器學習是一種通過利用數據,訓練出模型,然后使用模型預測的一種方法。
機器學習的過程與人類對歷史經驗歸納的過程做個比對。
3.機器學習的范圍
其實,機器學習跟模式識別,統計學習,數據挖掘,計算機視覺,語音識別,自然語言處理等領域有着很深的聯系。
從范圍上來說,機器學習跟模式識別,統計學習,數據挖掘是類似的,同時,機器學習與其他領域的處理技術的結合,形成了計算機視覺、語音識別、自然語言處理等交叉學科。因此,一般說數據挖掘時,可以等同於說機器學習。同時,我們平常所說的機器學習應用,應該是通用的,不僅僅局限在結構化數據,還有圖像,音頻等應用。
1.模式識別=機器學習。兩者的主要區別在於前者是從工業界發展起來的概念,后者則主要源自計算機學科。
2.數據挖掘=機器學習+數據庫。
3.統計學習近似等於機器學習。統計學習是個與機器學習高度重疊的學科。因為機器學習中的大多數方法來自統計學,甚至可以認為,統計學的發展促進機器學習的繁榮昌盛。
4.計算機視覺=圖像處理+機器學習。圖像處理技術用於將圖像處理為適合進入機器學習模型中的輸入,機器學習則負責從圖像中識別出相關的模式。
5.語音識別=語音處理+機器學習。語音識別就是音頻處理技術與機器學習的結合。
6.自然語言處理=文本處理+機器學習。自然語言處理技術主要是讓機器理解人類的語言的一門領域。在自然語言處理技術中,大量使用了編譯原理相關的技術,例如詞法分析,語法分析等等,除此之外,在理解這個層面,則使用了語義理解,機器學習等技術。
4.機器學習方法
其主要的有:1.監督學習算法:線性回歸、邏輯回歸、神經網絡、SVM;
2.無監督學習算法:聚類算法、降維算法;
3.特殊算法:推薦算法(既不屬於監督學習,也不屬於無監督學習)。
下面就神經網絡和SVM進行對比:
SVM是最優秀、准確而健壯的算法之一,維度不敏感,可處理線性可分和線性不可分數據。分為SVC和SVR。
優勢:分類性能好、穩定性高、算法更新快。
一般選擇RBF作為核函數。
SVM分類決策中起決定作用的是支持向量。
關鍵優化參數:
C:懲罰系數,值越高,懲罰程度越大,誤差容忍力越差。
Gamma:影響每個支持向量對應的高斯的作用范圍,值越大,泛化性能越差。
限制:
計算的復雜性取決於支持向量的數目,大規模訓練樣本難以實現。
用SVM解決多分類問題存在困難。
神經網絡是進行分布式並行信息處理的算法模型,依靠系統的復雜程度,通過調整內部大量節點之間相互相互連接的關系,達到處理信息的目的。
使用范圍:只能預測二項式數據,數值型數據。
過程:復雜,輸入層->隱藏層->輸出層
參數:訓練周期、學習速率、動量、衰減。
二者對比:二者都是“二標簽”分類任務
神經網絡:“黑匣子”,基於經驗風險最小化,易陷入局部最優,適合大樣本。
SVM:理論基礎扎實,基於結構風險最小化,泛化能力較好,具有全局最優性,適合小樣本。
4.機器學習、深度學習、人工智能三者關系
人工智能是機器學習的父類。深度學習則是機器學習的子類。如果把三者的關系用圖來表明的話,則是下圖: