自從讀研以來,給我印象最深的是數學的重要性。本科階段,一直很疑惑我們學習那些高數、概率統計、線性代數有什么用。有些人甚至認為那些課程都是在浪費時間,說是工作之后根本用不上。的確,在我去企業實習的過程中也很少能夠接觸到大學學習的數學知識。然而,進入研究生階段后,陸陸續續讀了一些paper,上了一些諸如機器學習、信息檢索等課程,這些課程里面涉及大量的數學內容,經過一段時間的學習之后,我會說數學對於計算機科學來說至關重要。如果你讀過《數學之美》,那你肯定會贊嘆於數學在解決工程問題方面具有如此的魅力。
前段時間,參加了一個在北航辦的關於雲計算、大數據、移動互聯網的高端論壇。這個論壇真的很高端,因為來好多重量級嘉賓,比如中國聯通總裁,百度總裁,用友總裁,龍湖地產董事長,微軟副總裁。。。現在很多人都在說大數據時代的到來,也都認為大數據存在很珍貴的價值。然而,如何從大數據中獲得價值,是一個值得研究的問題。近幾年,數據挖掘和機器學習成為了熱點技術,它們也是從大數據中獲取價值的關鍵技術。微軟的陸奇說,他的團隊每個人都必須據說一定的機器學習技能,可見機器學習的重要性。
參加了學校的機器學習課程,老師教得很好。感覺自己漸漸開始了解到底什么是機器學習了,也萌發了很強的研究興趣。然而,我要說機器學習的水很深,需要很強的數學功底和統計學功底。未來,這方面的技術也肯定會有很大的應用空間,所以,我覺得是時候開設一個分類,用於記錄機器學習的學習筆記或是心得。
PS:Matlab是神器,但我更喜歡用python,常用於科學計算的python模塊庫numpy和scipy。
分享一些好的機器學習的參考書籍:
1、Pattern Recognition And Machine Learning (老師重點推薦的書籍)
2、機器學習 (國內常用的教材)
3、Machine Learning in Action (偏實踐、很多代碼樣例、python)
4、集體智慧編程 (偏實踐、很多代碼樣例、python)