Python 數據分析 數據挖掘 學習路徑圖


轉載:自己學習使用

 

一  學好工具

python語言

推薦看廖雪峰的python3教程

數據分析python基礎

如list,tuple,dic,set等。我之后的博客會寫到。

 

二  獲取數據

python爬蟲

推薦一本書:《Python網絡數據采集》(web Scraping with Python)   Ryan Mitchell 寫的,非常好。讀完這本書+實戰幾次爬蟲你就算熟練了。我之后寫的爬蟲博客也會以讀這本書時的讀書筆記來寫。

實戰推薦崔慶才的博客,也可以看我之后寫的爬蟲實戰博客,我是按照他大框架來進行學習的。

 

三 數據的存儲與讀取

數據的IO,EXCEL,CSV,JSON,SQL數據庫。HDF5等。

 

四 NUMPY PANDAS SCIPY MATPLOTLIB

Numpy數組

Pandas 數據分析

Scipy 矩陣

Matplotlib 數據可視化

這一部分推薦看《Python數據分析》(Python Data Analysis)Lvan Idris寫的。

 

五 數據預處理

對采集來或現成的數據進行預處理,數據清洗(推薦看《干凈的數據=Clean data:數據清洗入門與實踐》作者:Megan Squire),數據集成,數據變換,數據規約等。這一部分有興趣可以看一本書 《Python數據分析與挖掘實戰》。這本書看個框架就行。其實寫的不咋的。浪費了我好久時間。

 

六 建模 機器學習

學習各種機器學習,數據分析算法。

算法原理推薦看《數據挖掘十大算法》作者:Xindong Wu,Vipin Kumar

python實現推薦看《Python數據分析與挖掘實戰》+《Python數據分析》+《機器學習實戰》

 

七 神經網絡

再往深就是深度學習,神經網絡。

 

寄語:

學習每一個都需要付出很大量時間,精力與努力。希望你是真的對數據挖掘,數據分析有興趣。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM