編者注:澳大利亞機器學習專家、暢銷書作者 Jason Brownlee,對機器學習領域的各類優質書籍進行了盤點,匯總成這份閱讀指南。在所篩選的學習資源中,這堪稱是迄今為止最全面、最完整、權威性比較高的一份 ML 書單,涵蓋了最值得學習者、從業者、開發者認真研讀的精品書目。這份指南適合多樣背景的讀者:從想要了解機器學習的普通人,到入門新手,再到高階開發者和學術研究人員。因此,雷鋒網對其進行編譯整理,特來與大家分享。
友情提醒:該指南只考慮了英文市場的機器學習圖書,適合大家作為國際 ML 讀物的參考。而例如周志華老師 《機器學習》等國內優秀著作並沒有體現,請讀者見諒。
Jason Brownlee:
我喜歡書,對於搞到的每一本機器學習書籍,我都要去讀。
我認為,有好的參考資源,是對你心中機器學習謎題進行“解惑”的最快方式。閱讀多本書,你就有了看待疑難問題的多種角度。
這份指南中,你會發現機器學習領域最值得一讀的好書。
有許多原因促使人們想要機器學習書籍。因此,我采用了三種不同方式對機器學習書籍進行分類、排列,使讀者們能按圖索驥快速查找。比方說:
-
依據類別(難易):教材,科普等。
-
依據話題:Python,深度學習等
-
依據出版商:Packt,O’Reilly 等
所有書都包括了亞馬遜或京東鏈接,你可以點擊鏈接了解更多。
如何使用這份指南?
-
找到一個你最感興趣的話題
-
瀏覽所選類別的書目
-
購書、借書、下載
-
從頭讀到尾
-
重復以上過程
把書擺在家里、辦公室顯眼的地方,跟你讀過那本書是兩碼事。別瞎搞收藏。
1.0 依據難易水平
1.1 機器學習科普讀物
這是面向普通大眾的機器學習書目。它們讓你體會到機器學習和數據科學的優點和益處,但免去了理論和應用細節。我還加入了一些個人非常喜歡的、偏“統計思維”的流行科普讀物。
-
The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World
-
Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die
譯本:大數據預測
-
The Signal and the Noise: Why So Many Predictions Fail–but Some Don't
該類別的首選是: The Signal and the Noise
與上述讀物的樂觀相比,提供了反面觀點的是:Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy.
1.2 初學者書籍
真正面向零基礎初學者的機器學習書籍,基本上是一片市場空白。下面的這些書,既包含了科普讀物(見 1.1)中使用機器學習的益處,也部分包含了多見於入門書籍(見 1.3)的應用細節。
-
Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking
-
Data Smart: Using Data Science to Transform Information into Insight
-
Data Mining: Practical Machine Learning Tools and Techniques (第四版)
-
譯本:數據科學實戰
該類別的首選是:Data Mining: Practical Machine Learning Tools and Techniques (數據挖掘:實用機器學習工具與技術)
1.3 機器學習入門書籍
下面是菜鳥入門的首選書單。相當於本科生級別的機器學習資源,適合基礎學習者以及開發者新手。它們覆蓋了廣泛的機器學習話題,傾向於“怎么做”,而非“為什么”或是探討理論。
-
Machine Learning for Hackers: Case Studies and Algorithms to Get You Started
譯本:機器學習:實用案例解析
-
譯本:機器學習實戰
-
Programming Collective Intelligence: Building Smart Web 2.0 Applications
譯本:集體智慧編程
-
An Introduction to Statistical Learning: with Applications in R
譯本:統計學習導論:基於R應用
-
譯本:應用預測建模
該類別的首選是:An Introduction to Statistical Learning: with Applications in R (統計學習導論:基於R應用)
1.4 (國外)機器學習教科書
下面是世界一流機器學習教材的列表。這些是研究生課程中會使用到的教科書,覆蓋了一系列方法和背后的理論。
-
The Elements of Statistical Learning: Data Mining, Inference, and Prediction
-
Machine Learning: The Art and Science of Algorithms that Make Sense of Data
譯本:機器學習
該類別的首選是: The Elements of Statistical Learning: Data Mining, Inference, and Prediction (統計學習基礎:數據挖掘、推理與預測)
2.0 依據話題
2.1 與 R 語言相關
R 語言平台的應用機器學習書目。
-
R for Data Science: Import, Tidy, Transform, Visualize, and Model Data
-
Machine Learning With R Cookbook – 110 Recipes for Building Powerful Predictive Models with R
國內名為:R語言機器學習參考手冊(英文影印版)
-
An Introduction to Statistical Learning: with Applications in R
譯本:統計學習導論:基於R應用
-
譯本:應用預測建模
該類別的首選是:Applied Predictive Modeling(應用預測建模)
2.2 與 Python 相關
使用 Python 或 SciPy 語言平台的應用機器學習書目。
-
國內名為:Python 語言構建機器學習系統(英文影印版)
-
Introduction to Machine Learning with Python: A Guide for Data Scientists
-
Machine Learning in Python: Essential Techniques for Predictive Analysis
-
Python Data Science Handbook: Essential Tools for Working with Data
-
Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
該類別的首選是: Python Machine Learning (Python 語言構建機器學習系統)
2.3 深度學習
深度學習書目。現在沒幾本深度學習的好書,所以我只得用數量彌補質量。其中有許多專門針對 Tesnorflow 的教程。雷鋒網注:該類推薦書目“全軍覆沒”——沒有一本書有中文譯本。這或許是因為深度學習領域理論框架尚不完善,缺乏影響力巨大的著作。
-
Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms
-
Learning TensorFlow: A guide to building deep learning systems
-
TensorFlow for Machine Intelligence: A Hands-On Introduction to Learning Algorithms
該類別毫無疑問的首選是:Deep Learning.
另外,Michael Nielsen 的免費電子書 Neural Networks and Deep Learning 簡單易懂,深受許多入門學習者的喜愛,雷鋒網將其添加在這里,以作補充。
2.4 時間序列預測
時間序列預測領域最值得一讀的書目。在該技術的應用方面,目前 R 語言是霸主。
該類別的入門首選是:Forecasting: principles and practice.
該類別的首選教材是:Time Series Analysis: Forecasting and Control.
3.0 依據出版商
有三個出版商在機器學習領域下了大力氣,並且在認真出版圖書。
它們是: O'Reilly, Manning 和 Packt。它們的焦點是應用書籍。該榜單上的書籍質量參差不齊:從嚴謹設計、編排的圖書到裝訂在一起的博文。
3.1 O'Reilly 機器學習書籍
在它們的“數據”類別,O'Reilly 有超過 100 本圖書,許多與機器學習相關。以下是最暢銷的幾本:
-
Programming Collective Intelligence: Building Smart Web 2.0 Applications
譯本:集體智慧編程
-
Introduction to Machine Learning with Python: A Guide for Data Scientists
-
Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms
-
Data Science from Scratch: First Principles with Python
譯本:數據科學入門
-
Python Data Science Handbook: Essential Tools for Working with Data
這些書中,Programming Collective Intelligence: Building Smart Web 2.0 Applications (集體智慧編程) 或許是開創了 O'Reilly 該目錄的書,一直很受歡迎。
3.2 Manning 機器學習書籍
Manning 的書偏實用,並且質量還行,雖然數量沒 O’Reilly 和 Packt 那么多。
Manning 目錄里較突出的一本是 Machine Learning in Action(機器學習實戰),這也許同樣是因為,它是該出版社在機器學習和數據科學領域的第一本出版物。
3.3 Packt 機器學習書籍
感覺上 Packt 全面擁抱了數據科學和機器學習領域的圖書出版。他們有一大堆針對晦澀難懂機器學習庫的書。在流行話題上面,比如 R 和 Python,也有不少書籍出版。雷鋒網注:可惜的是,Packt 似乎不重視漢語市場,旗下主要機器學習圖書並沒有中文譯本。
以下是一些較流行的書目: