Python數據分析-初識numpy、pandas、scipy、matplotlib和Scikit-Learn等數據處理庫


1.numpy- 支持多維數組與矩陣的科學計算器包

功能:常用功能16條

a. ndarray-n維數組/矢量的操作。

b. 支持高級大量的n維數組與矩陣的運算。

c. 針對數組運算提供大量的數學函數庫。

2.scipy-配合numpy完成對矩陣的計算,因此依賴於numpy,且含多個子模塊

功能:常用15個函數

a. 標准導入方式-由於scipy中的函數基本都是numpy的主函數,因此通常不用import scipy

1 import numpy as np
2 from scipy import stats #導入統計功能

b.一些常用功能模塊

包括統計,優化,整合,線性代數模塊,傅里葉變換,信號和圖像處理,常微分方程求解器等等。

3.pandas-建立在numpy之上

a.標注導入方式

1 import numpy as np
2 import pandas as pd

b.n維數組的創建和操作

Series(對映一維數組),DataFrame(對映二維數組),Panel(對映三維數組),Panel4D(對映四維數組),PanelND(多維)等數據結構,常用的是Series和DataFrame。

4.matplotlib-數據的可視化,用於畫圖操作,內包含多個模塊

功能:繪制散點圖、條形圖等二維圖、pyplot等常用模塊

a.標注導入方式-依賴於numpy

1 import numpy as np
2 import matplot as plt

b. statsmodel可以補充scipy.stats,而且支持時間序列

 5.Scikit-Learn-包含大量機器學習算法、數據集

功能:Python開發的機器學習庫,是數據挖掘方便的工具,需要在NumPy和SciPy基礎上安裝。

a.導入算法方式

1 from sklearn import linear_model#導入線性回歸模型

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM