1.pandas
pandas是用於處理和分析數據的python庫,它基於一種叫做DataFrame的數據結構,簡單來說,一個pandas dataframe就是一張表格,類似excel表格,pandas里面含有大量用於修改表格和操作表格的方法,尤其是可以像SQL一樣對表格進行查詢和連接,pandas強大之處在於可以從許多文件格式和數據庫中提取數據,如SQL、EXCEL文件和逗號分隔值文件。下面是利用字典創建DataFrame的一個小例子。
第一步:輸入代碼
1 import pandas as pd 2 from IPython.display import display 3 #創建關於人的簡單數據集 4 data={'Name':["Jone","Anna","Peter","Linda"], 5 'Location':["New York","Paris","Berlin","Londonn"], 6 'Age':[24,13,56,34] 7 } 8 data_pandas=pd.DataFrame(data) 9 #IPython.display可以在Jupyter Notebook中打印出“美觀的”DataFrame 10 display(data_pandas)
第二步:點擊Run查看結果
2.matplotlib
matplotlib是python的主要科學繪畫圖庫,其功能是可發布的可視化內容,如折線圖、直方圖、散點圖等。
第一步:輸入代碼
1 import numpy as np 2 import matplotlib.pyplot as plt 3 x=np.linspace(-10,10,100) 4 y=np.sin(x) 5 plt.plot(x,y,marker="x")
第二步:點擊Run查看結果
3.numpy
numpy是python科學計算中的基礎包之一,它的功能包括多維數組、高級數學函數(比如線性代數運算和傅里葉變換),以及為隨機生成器。numpyi數組是基本數據結構,numpy的核心功能是ndarray,及多維數組。例如:
第一步:輸入代碼
1 import numpy as np 2 x=np.array([[1,2,3],[4,5,6]]) 3 print("x:\n{}".format(x))
第二步:點擊Run查看結果
4.scipy
scipy是python中用於科學計算的函數集合,它具有線性代數高級程序、數學函數優化、信號處理、特殊數學函數、統計分布等多項功能。scipy中最重要的是scipy.sparce:它可以給出稀疏矩陣。如果想保存一個大部分元素都是0的二維數組,就可以使用稀疏矩陣。例如:
第一步:輸入代碼
1 from scipy import sparse 2 eye=np.eye(4) 3 print("Numpy array:\n{}".format(eye))
第二步:點擊Run查看結果