斯坦福大學的Machine Learning課程(講師是Andrew Ng)公開課是學習機器學習的“聖經”,以下內容是聽課筆記。
一、何謂機器學習
Machine Learning is field of study that gives computers the ability to learn without being explicitly programmed.
也就是說機器學習不需要制定具體的模型,而是讓計算機根據龐大的數據量自己訓練模型,與之相對的,例如CFD軟件,是建立在物理模型之上的,例如輸運方程等。
二、監督學習(Supervised learning)
數據集中的每個樣本有相應的“正確答案”,根據這些樣本做出預測,分有兩類:回歸問題和分類問題
(1)回歸問題
例如預測房價,根據樣本集擬合出一條連續曲線

(2)分類問題
例如:根據腫瘤特征判斷良性還是惡性,得到的是結果是“良性”或者“惡性”,是離散的

二、非監督學習(Unsupervised learning)
非監督學習的數據集跟監督學習不同,沒有任何標簽,即沒有相應的“正確答案”。從數據集中可以通過非監督學習得到數據的某種結構,可能是把數據分成兩個不同的聚集簇,稱為聚類算法。
例如:


