轉載:自己學習使用

一 學好工具
python語言
推薦看廖雪峰的python3教程。
數據分析python基礎
如list,tuple,dic,set等。我之后的博客會寫到。
二 獲取數據
python爬蟲
推薦一本書:《Python網絡數據采集》(web Scraping with Python) Ryan Mitchell 寫的,非常好。讀完這本書+實戰幾次爬蟲你就算熟練了。我之后寫的爬蟲博客也會以讀這本書時的讀書筆記來寫。
實戰推薦崔慶才的博客,也可以看我之后寫的爬蟲實戰博客,我是按照他大框架來進行學習的。
三 數據的存儲與讀取
數據的IO,EXCEL,CSV,JSON,SQL數據庫。HDF5等。
四 NUMPY PANDAS SCIPY MATPLOTLIB
Numpy數組
Pandas 數據分析
Scipy 矩陣
Matplotlib 數據可視化
這一部分推薦看《Python數據分析》(Python Data Analysis)Lvan Idris寫的。
五 數據預處理
對采集來或現成的數據進行預處理,數據清洗(推薦看《干凈的數據=Clean data:數據清洗入門與實踐》作者:Megan Squire),數據集成,數據變換,數據規約等。這一部分有興趣可以看一本書 《Python數據分析與挖掘實戰》。這本書看個框架就行。其實寫的不咋的。浪費了我好久時間。
六 建模 機器學習
學習各種機器學習,數據分析算法。
算法原理推薦看《數據挖掘十大算法》作者:Xindong Wu,Vipin Kumar
python實現推薦看《Python數據分析與挖掘實戰》+《Python數據分析》+《機器學習實戰》
七 神經網絡
再往深就是深度學習,神經網絡。
寄語:
學習每一個都需要付出很大量時間,精力與努力。希望你是真的對數據挖掘,數據分析有興趣。
