下面是大數據學習的基本經典書籍,有興趣的同仁可以買來翻翻
1. 深入淺出數據分析
這書挺簡單的,基本的內容都涉及了,說得也比較清楚,最后談到了R是大加分。
難易程度:非常易。
2.啤酒與尿布
通過案例來說事情,而且是最經典的例子。
難易程度:非常易。
3.數據之美
一本介紹性的書籍,每章都解決一個具體的問題,甚至還有代碼,對理解數據分析的應用領域和做法非常有幫助。
難易程度:易。
4.集體智慧編程
學習數據分析、數據挖掘、機器學習人員應該仔細閱讀的第一本書。作者通過實際例子介紹了機器學習和數據挖掘中的算法,淺顯易懂,還有可執行的Python代碼。
難易程度:中。
5.Machine Learning in Action
用人話把復雜難懂的機器學習算法解釋清楚了,其中有零星的數學公式,但是是以解釋清楚為目的的。而且有Python代碼,大贊!目前中科院的王斌老師(微博: @王斌_ICTIR)已經翻譯這本書了 機器學習實戰 (豆瓣)。這本書本身質量就很高,王老師的翻譯質量也很高。
難易程度:中。
6.推薦系統實踐
這本書不用說了,研究推薦系統必須要讀的書,而且是第一本要讀的書。
難易程度:中上。
7.數據挖掘導論
最近幾年數據挖掘教材中比較好的一本書,被美國諸多大學的數據挖掘課作為教材,沒有推薦Jiawei Han老師的那本書,因為個人覺得那本書對於初學者來說不太容易讀懂。
難易程度:中上。
8.The Elements of Statistical Learning
這本書有對應的中文版:統計學習基礎 (豆瓣)。書中配有R包,非常贊!可以參照着代碼學習算法。
難易程度:難。
9.統計學習方法
李航老師的扛鼎之作,強烈推薦。
難易程度:難。
10.Pattern Recognition And Machine Learning
經典中的經典。
11.Machine Learning
去年出版的新書,作者Kevin Murrphy教授是機器學習領域中年少有為的代表。這書是他的集大成之作,寫完之后,就去Google了,產學研結合,沒有比這個更好的了。
12.Bayesian Reasoning and Machine Learning
看名字就知道了,徹徹底底的Bayesian學派的書,里面的內容非常多,有一張圖將機器學習中設計算法的關系總結了一下,很棒。
13.Machine Learning for Hackers
也是通過實例講解機器學習算法,用R實現的,可以一邊學習機器學習一邊學習R。
14.Probabilistic Graphical Models
鴻篇巨制,這書誰要是讀完了告訴我一聲。
15.Convex Optimization
凸優化中最好的教材,沒有之一了。課程也非常棒,Stephen老師拿着紙一步一步推到,圖一點一點畫,太棒了。
16.Graphical Models, Exponential Families, and Variational Inference
這個是Jordan老爺子和他的得意門徒 Martin J Wainwright 在 Foundation of Machine Learning Research上的創刊號,可以免費下載,比較難懂,但是一旦讀通了,graphical model的相關內容就可以踏平了。
17.Introduction to Semi-Supervised Learning
半監督學習必讀必看的書。
18.Learning to Rank for Information Retrieval
微軟亞院劉鐵岩老師關於LTR的著作,啥都不說了,推薦!
19.Learning to Rank for Information Retrieval and Natural Language Processing
李航老師關於LTR的書,也是當時他在微軟亞院時候的書,可見微軟亞院對LTR的研究之深,貢獻之大。
20.SciPy and NumPy
這本書可以歸類為數據分析書吧,因為numpy和scipy真的是非常強大啊。
21.Python for Data Analysis
作者是Pandas這個包的作者,看過他在Scipy會議上的演講,實例非常強,用pandas做數據分析!
22.Bad Data Handbook
很好玩的書,作者的角度很不同。