初識機器學習
機器學習主要源於2個領域:人工智能和數據科學。
人工智能
人工智能是創造出與人類一樣聰明的機器,在這個方向上,該領域又分為不同的學派,包括關注構建像人類一樣思考的認知系統。
人工智能(AI)的難題:
1.所有的智能體都只有很少的計算資源、很低的處理速度和很小的內存等等。
2.所有的計算都是局部的,但是大多數AI問題都有全局約束。
3.計算邏輯基本上是演繹邏輯,但是許多AI問題本質上是溯因性或歸納性
4.世界是動態變化的,知識是有限的,但AI智能體必須始終從它已知道的東西開始
5.解決問題、推理和學習已經足夠復雜,但是解釋和證明增加了這種復雜性
人工智能(AI)的特征:
1.在許多AI問題中,數據是陸續出現的,而不是一開始就出現所有數據
2.問題常常會重復出現,同類問題會一再出現
3.問題在許多不同的抽象層面上出現
4.許多引人關注的AI問題難以通過計算來解決
5.外界是動態的,是不斷變化的,但是有關外界的知識是相對不變的
6.外界是開放的,但有關外界的知識是相對有限的
因此問題變成我們如何能設計出AI智能體來解決具有這些特征的AI問題。
數據科學家
同時掌握了多種不同技能的人,數據科學家了解數學和統計學知識,這使他們可以在海量的數據中找出引人關注的見解,他們還具備編程技能,可以通過代碼建立統計模型,並從各種不同的數據源中獲取數據,此外,數據科學家還知道如何提出正確的問題,並將這些問題轉換為全面的分析,完成分析后,他們運用溝通技能,以人們易於理解的方式報告他們的發現,換言之,數據科學家能夠對龐大的數據集執行復雜的分析,在完成分析之后,他們還能夠編制信息圖,以將他們的發現傳遞給其他人。