一、Series panda最基本的對象
# pandas的基礎
s=pd.Series([1,3,6,np.nan,44,1])#建立個簡單的基本對象 類似一個一位數組
print("建立個簡單的基本對象 類似一個一位數組")
print(s)
s=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
print("命名相關的索引")
print(s)
s.name="xuhan"#series的每個對象都有一個對應的索引和名稱
s.index.name="行名"#對行索引進行命名
print("對行名和整個表的名稱進行相關的命名:")
print(s)
# 切片操作
print("切片操作")#按行切片
print(s[1:3])
執行結果
建立個簡單的基本對象 類似一個一位數組 0 1.0 1 3.0 2 6.0 3 NaN 4 44.0 5 1.0 dtype: float64 命名相關的索引 a 1 b 2 c 3 d 4 e 5 dtype: int64 對行名和列名進行相關的命名: 行名 a 1 b 2 c 3 d 4 e 5 Name: xuhan, dtype: int64 切片操作 行名 b 2 c 3 Name: xuhan, dtype: int64
二、Dataframe
2.1創建
# dataframe 的創建 dates=pd.date_range('20160101',periods=6,name="定義的日期表")#pd中的時間序列 從20160101開始 # # print(dates) # 第一個參數表示表內的矩陣 第二個參數是每一行的索引 第三個表示沒一列的索引 df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=['a','b','c','d']) print(df) df2=pd.DataFrame(np.arange(1,13).reshape(3,4),index=list('123'),columns=list('abcd')) print(df2) df=pd.DataFrame(np.arange(12).reshape(3,4)) print(df)
結果:
a b c d 定義的日期表 2016-01-01 0.776594 -0.166321 0.156607 0.576739 2016-01-02 -1.649947 1.274599 0.571282 -0.605256 2016-01-03 -1.361043 0.013429 2.148883 -0.506440 2016-01-04 1.609952 0.498063 -0.763137 1.639300 2016-01-05 0.182889 0.630330 1.221402 -0.942096 2016-01-06 -0.348916 1.339488 1.477448 -1.320836 a b c d 1 1 2 3 4 2 5 6 7 8 3 9 10 11 12 0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11
2.2對Frame中數據的排序
df=pd.DataFrame(np.arange(12).reshape(3,4)) print(df) print("輸出表格內的數據") print(df.values)#values 表示輸出表內的一系列數據 print("輸出對列索引的倒敘排序") print(df.sort_index(axis=1,ascending=False))# 對列索引進行排序 就是對每一行的數據進行排序 print("輸出對行索引的倒敘排序") print(df.sort_index(axis=0,ascending=False))#0是對行索引進行排序 print("對某一行的固定排序") print(df.sort_values(by=1,ascending=False))#按某一列進行固定的排序 print("輸出表格的相關描述") print(df.describe())#count數量 mean平均值 std標准差 min最小值
結果:
0 1 2 3 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11 輸出表格內的數據 [[ 0 1 2 3] [ 4 5 6 7] [ 8 9 10 11]] 輸出對列索引的倒敘排序 3 2 1 0 0 3 2 1 0 1 7 6 5 4 2 11 10 9 8 輸出對行索引的倒敘排序 0 1 2 3 2 8 9 10 11 1 4 5 6 7 0 0 1 2 3 對某一行的固定排序 0 1 2 3 2 8 9 10 11 1 4 5 6 7 0 0 1 2 3 輸出表格的相關描述 0 1 2 3 count 3.0 3.0 3.0 3.0 mean 4.0 5.0 6.0 7.0 std 4.0 4.0 4.0 4.0 min 0.0 1.0 2.0 3.0 25% 2.0 3.0 4.0 5.0 50% 4.0 5.0 6.0 7.0 75% 6.0 7.0 8.0 9.0 max 8.0 9.0 10.0 11.0