不同於模式識別中人類主動去描述某些特征給機器,機器學習可以這樣理解:機器從已知的經驗數據(樣本)中,通過某種特定的方法(算法),自己去尋找提煉(訓練/學習)出一些規律(模型);提煉出的規律就可以用來判斷一些未知的事情(預測)。
也就是說,模式識別和機器學習的區別在於:前者喂給機器的是各種特征描述,從而讓機器對未知的事物進行判斷;后者喂給機器的是某一事物的海量樣本,讓機器通過樣本來自己發現特征,最后去判斷某些未知的事物。
機器根據某一事物的海量樣本,總結出這一類型事物所具有的普遍規律,總結過程所使用的技能就是我們常說的算法。當足夠多的樣本使得算法能夠總結出一套行之有效的規律后,機器就可以用這些規律對真實世界中的事件做出決策和預測。
比如,機器通過一百萬個單身狗的樣本,總結出了單身狗所具有的一些屬性。當下次再給一個樣本時,機器就可以很快判斷出這個樣本究竟是不是單身狗。
例如年齡的數字,身高的數字,膚色的RGB,學識的等級,還有掌握的其他技能例如撒嬌、體貼、男子力、女子力,性格的歸類,社交程度的評價等等。
但是,最重要的一個參數就是臉,嗯,沒錯,就是我們常說的顏值。
值得一提的是,在機器學習中,盡管電腦可以自行通過樣本總結規律,但是依舊需要人工干預來為其提供規律總結的方向以及維度。例如色彩識別需要統計色彩的RGB或者CMYK值,但是要想總結出單身狗的特質,需要統計的就不僅僅是一兩個簡單的維度了。
在機器學習領域有着許多不同的流派,不同流派間的算法與建構的模型也是千差萬別。就像是在武林江湖中,大家都有一技之能傍身,有人是內功修行,有人是外在技術修行,雖然都是一等一的高手,但是降龍十八掌和獨孤九劍則代表了不同的武學巔峰。