一、Python概述
Python與Excel對比。
Excel:1.具備強大的功能,但面對大量的數據,處理麻煩,處理速度無法滿足需求。
2.Excel停留在描述性分析階段,例如:對比分析,趨勢分析,結構分析等。
Python:1.Python語言強大而靈活,通過編寫代碼具有不同的功能,比Excel功能更強大。比如專業的統計分析,數據挖掘分析,預測分析等。
數據對比
Excel主要處理規律可循或者明顯的數據。
Python能夠處理雜亂、無規律的數據。比如提出數據的關鍵詞。
流程對比
簡單易學。
二、NumPy——第三方擴展庫
概述
1.是Python數組計算、矩陣計算和科學計算的核心庫。
2.NumPy提供一個高性能的數組對象,讓我們輕松創建一維數組、二維數組和多維數組,以及大量的函數和方法。
使用NumPy的原因
對於數值計算任務,使用NumPy要比直接編寫Python代碼快捷得多。
*NumPy能夠直接對數據和矩陣進行操作,可以省略很多循環語句。
*NumPy眾多的數學函數能簡化編寫代碼的工作。
Pandas
1.專門用於數據分析的開源Python庫。
2.Python核心數據分析庫,能夠處理各類數據。
例:*與SQL或Excel表格類似的數據。
*有序和無序(非固定頻率)的時間序列數據。即有無規律
*帶行列標簽的矩陣數據。
*任意其他形式的觀測、統計數據集。
3.優勢
*處理浮點與非浮點數據的缺失數據。用NAN代替顯示缺失。
*大小可變,例如插入或刪除DataFrame等多維對象的列。
*自動、顯式的數據對齊,顯式地將對象與一組標簽對齊。
*強大、靈活的分組統計功能,即數據聚合、數據轉換。
*靈活地合並、連接、重塑、透視數據集。
*成熟的導入導出工具。
*時間序列。——日期范圍生成,頻率轉換等
三、Matplotlib
1.簡介
是一個Python 2D 繪圖庫,是Python 2D 繪圖領域使用最廣泛的套件。能讓使用者輕松地將數據圖形化,並且提供多樣化的輸出格式。
只需幾行代碼就可以繪制各種折線圖、餅圖等。
2.繪制圖表
*基礎圖表:直方圖——反映數據分布,x軸為定類數據。等
*高級圖表:堆疊柱形圖等
*3D圖表
3.優點
*免費
*繼承Python語法的優點。
*可借助Python強大的拓展模塊嵌入在圖形用戶界面應用程序中,也可以嵌入在網頁中。
使用
1.導入快速繪圖的函數庫——pyplot子庫。(plt)pyplot是Matplotlib的子庫,該子庫可以快速繪制 2D 圖表。使用 import 語句導入plt 。
代碼:import matplotlib.pylot as plt
2.繪制圖表,代碼如下:
3.保存和顯示圖表——show函數
代碼:plt.show()