很久沒寫過博客了,一重開就給自己挖了這么一個大坑……
最近一段時間看了《機器學習實戰》這本書,感覺寫得不錯,認真看了看。關於這本書的書評及購買事宜請移步豆瓣、京東、亞馬遜等網站,這里不多說。不過有一點,感覺這本書有個很好的地方是給出了各個算法的Python實現代碼和講解,要求不高的話可以拿來用了(懶)。在這里想好好寫寫從這本書中學到的東西,文中的代碼和主要內容也將均來自這本書。
目錄
第一部分 分類
第4章 基於概率論的分類方法:朴素貝葉斯
第5章 Logistic回歸
第6章 支持向量機
第7章 利用Adaboost元算法提高分類性能
第二部分 利用回歸預測數值型數據
第8章 預測數值型數據:回歸
第9章 樹回歸
第三部分 無監督學習
第10章 利用K-均值聚類算法對未標注數據分組
第四部分 其他工具
第13章 利用PCA來簡化數據
第14章 利用SVD簡化數據
第15章 大數據與MapReduce
本書的主頁:https://www.manning.com/books/machine-learning-in-action
書中的代碼和所使用的數據集可以在主頁或者這里(作者的GitHub版本庫)找到。
書中有的代碼均使用Python 2.7,並廣泛使用了NumPy模塊,若干章中還使用了Matplotlib模塊進行繪圖。可以安裝Python 2.7的官方發行版,然后依次安裝NumPy和Matplotlib模塊(需要解決依賴)。在這里推薦直接安裝Python發行版Anaconda,已經內置了很多科學計算所需的模塊,可直接使用。