數據挖掘、數據分析的書籍推薦


這篇博客主要總結一下數據挖掘、數據分析領域相關書籍,主要參考了知乎上的問題在數據分析、挖掘方面,有哪些好書值得推薦

首先推薦周志華寫的機器學習。我最近也在讀這本書,優點是適合入門,知識大而全,缺點是每個知識點介紹的不深入(這也沒辦法,要是面面俱到,一本書根本寫不完)。

入門讀物

  • 深入淺出數據分析。這書挺簡單的,基本的內容都涉及了,說得也比較清楚,最后談到了R是大加分。難易程度:非常易。
  • 啤酒與尿布。通過案例來說事情,而且是最經典的例子。難易程度:非常易。
  • 數據之美。一本介紹性的書籍,每章都解決一個具體的問題,甚至還有代碼,對理解數據分析的應用領域和做法非常有幫助。難易程度:易。
  • 數學之美。吳軍博士寫的,作為科普讀物還不錯。

數據分析

  • SciPy and NumPy。numpy和scipy很好很強大
  • Python for Data Analysis。
  • Bad Data Handbook。

數據挖掘入門書籍

  • 集體智慧編程。經典書籍,入門必讀。
  • 機器學習實戰。理論很好,代碼質量一般般。優點是讓你看看如何實現這些算法,缺點是書中的代碼幾乎用不上。
  • 數據挖掘導論。研究生期間的教材,通俗易懂,習題很贊。
  • Machine Learning for Hackers。算法用R實現。

中階

  • Introduction to Semi-Supervised Learning
  • Learning to Rank for Information Retrieval
  • Learning to Rank for Information Retrieval and Natural Language Processing
  • 推薦系統實踐。推薦系統入門首選
  • Natural Language Processing with Python。NLP 經典,其實主要是講NLTK包

高階

  • The Elements of Statistical Learning。很難,啃完不容易。
  • 統計學習方法。李航老師的扛鼎之作,強烈推薦。
  • Machine Learning。作者Kevin Murrphy教授是機器學習領域中年少有為的代表。這書是他的集大成之作,寫完之后,就去Google了,產學研結合,沒有比這個更好的了。
  • Pattern Recognition And Machine Learning。PRML地位不解釋。
  • Bayesian Reasoning and Machine Learning。Bayesian學派的書,里面的內容非常多,有一張圖將機器學習中設計算法的關系總結了一下,很棒。
  • Probabilistic Graphical Models。非常非常難。
  • Convex Optimization (豆瓣) 凸優化中最好的教材,沒有之一了。
  • Learning from data。林軒田老師作品。

寫在后面,看了肖博士的答案,確實比其他答案好不少,專業且全面,而且有針對性。除了書籍,后續我會補充一些公開課資源。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM