Python 數據分析學習路線
概述
數據分析:
數據分析是指用適當利用統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
分析數據,得到結果
學習路線
基礎部分:
- 數學知識
- Python基礎知識
- Python數據分析包使用
進階部分:
- 網頁爬蟲
- 機器學習和深度學習
- 大數據
基礎部分
數學
需要的知識主要為 《概率論與數理統計》
Python基礎知識
由於只需要掌握計算部分的知識,Python 的基礎知識需要了解以下內容:
- 基本語法
- 數據類型和變量
- 條件語句和循環語句
- 函數和模塊的概念
Python數據分析包
主要掌握 Python 相關數據分析包的使用,三劍客:
- numpy
- pandas
- matplotlib
參考的書為《利用 Python 進行數據分析》
進階部分
網頁爬蟲
《Python3網絡爬蟲開發實戰》崔慶才
機器學習和深度學習
學習SQL,這是數據分析最基礎的能力
大體上掌握各類算法原理以及如何利用機器學習包
理論書籍:
- 《機器學習》, 周志華
- 《統計學習方法》, 李航
機器學習包:
-
scikit-learn
是一個機器學習庫,可以對數據進行分類,回歸,無監督,數據降維,數據預處理等等,包含了常見的大部分機器學習方法。
深度學習就是各種神經網絡如何解算的問題。
大數據
Hadoop 權威指南