一、pandas核心數據結構:Series
理解:Series可以理解為一個一維的數組,只是index可以自己改動。類似於定長的有序字典,有Index和value。
創建的方法統一為:pd.Series(data,index=)
1)打印的時候按照index賦值的順序
2)index參數默認從0開始的整數,也是Series的絕對位置,即使index被賦值之后,絕對位置不會被覆蓋,index賦值必須是list類型。
Series可以通過以下形式創建:python的dict、umpy當中的ndarray(numpy中的基本數據結構)、具體某個數值。
代碼:
import pandas as pd # 創建一組Series數據 print(("---------------案例1--------------")) # 書寫格式1: 列表格式 s1 = pd.Series([90,86,70],index=["Leo","Kate","John"]) print(s1) # 書寫格式2:字典格式 dict={"leo":90,"kate":86,"john":70} s2 = pd.Series(dict) print("s2=","\n",s2) print(("--------------案例2--------------")) s3=pd.Series([3,-5,7,4],index=list('ABCD')) print("s3=","\n",s3)
結果圖:
二、pandas核心數據結構:DataFrame
理解:DataFrame是一個類似於表格的數據類型,DataFrame可以理解為一個二維數組,index有兩個維度,可更改。
DataFrame參數:
data (方框內的數據) :numpy ndarray、dict、 DataFrame
index(行索引索引) :Index or array-like
columns (列索引) :Index or array-like
dtype(data的數據類型) :dtype, 默認為 None
DataFrame統一的創建形式為:pd.DataFrame(data,columns=,index=)
其中columns為列的索引,index為行的索引。
index或者columns如果不進行設置則默認為0開始的整數。
代碼:
import pandas as pd print("---------案例1:--------------") # 創建DataFrame,列名是:'name'、'gender'、'age' df = pd.DataFrame([['Snow','M',22], ['Tyrion','M',32], ['Sansa','F',18], ['Arya','F',14]], columns=['name','gender','age']) print(df) print("---------案例2:--------------") # DataFrame創建,列名是:'Country'、'Capital'、'Population' data=[['Belglum','Brussels',11190846], ['Indla','New Delhi',1303171035], ['Brazil','Brasilia',207847528]] # index如果不寫,默認從0開始序列,下面設置了從1開始序列 df1=pd.DataFrame(data=data,index=[1,2,3],columns=['Country','Capital','Population']) print(df1)
結果圖: