Panda的學習之路(1)——series 和 Dataframe


一、Series panda最基本的對象

# pandas的基礎
s=pd.Series([1,3,6,np.nan,44,1])#建立個簡單的基本對象 類似一個一位數組
print("建立個簡單的基本對象 類似一個一位數組")
print(s)
s=pd.Series([1,2,3,4,5],index=['a','b','c','d','e'])
print("命名相關的索引")
print(s)
s.name="xuhan"#series的每個對象都有一個對應的索引和名稱
s.index.name="行名"#對行索引進行命名
print("對行名和整個表的名稱進行相關的命名:")
print(s)
# 切片操作
print("切片操作")#按行切片
print(s[1:3])

執行結果

建立個簡單的基本對象 類似一個一位數組
0     1.0
1     3.0
2     6.0
3     NaN
4    44.0
5     1.0
dtype: float64
命名相關的索引
a    1
b    2
c    3
d    4
e    5
dtype: int64
對行名和列名進行相關的命名:
行名
a    1
b    2
c    3
d    4
e    5
Name: xuhan, dtype: int64
切片操作
行名
b    2
c    3
Name: xuhan, dtype: int64

二、Dataframe

2.1創建

# dataframe 的創建
dates=pd.date_range('20160101',periods=6,name="定義的日期表")#pd中的時間序列 從20160101開始
# # print(dates)
# 第一個參數表示表內的矩陣  第二個參數是每一行的索引  第三個表示沒一列的索引
df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=['a','b','c','d'])
print(df)
df2=pd.DataFrame(np.arange(1,13).reshape(3,4),index=list('123'),columns=list('abcd'))
print(df2)
df=pd.DataFrame(np.arange(12).reshape(3,4))
print(df)

結果:

                   a         b         c         d
定義的日期表                                            
2016-01-01  0.776594 -0.166321  0.156607  0.576739
2016-01-02 -1.649947  1.274599  0.571282 -0.605256
2016-01-03 -1.361043  0.013429  2.148883 -0.506440
2016-01-04  1.609952  0.498063 -0.763137  1.639300
2016-01-05  0.182889  0.630330  1.221402 -0.942096
2016-01-06 -0.348916  1.339488  1.477448 -1.320836
   a   b   c   d
1  1   2   3   4
2  5   6   7   8
3  9  10  11  12
   0  1   2   3
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11

2.2對Frame中數據的排序

df=pd.DataFrame(np.arange(12).reshape(3,4))
print(df)

print("輸出表格內的數據")
print(df.values)#values 表示輸出表內的一系列數據

print("輸出對列索引的倒敘排序")
print(df.sort_index(axis=1,ascending=False))# 對列索引進行排序 就是對每一行的數據進行排序
print("輸出對行索引的倒敘排序")
print(df.sort_index(axis=0,ascending=False))#0是對行索引進行排序
print("對某一行的固定排序")
print(df.sort_values(by=1,ascending=False))#按某一列進行固定的排序
print("輸出表格的相關描述")
print(df.describe())#count數量 mean平均值 std標准差 min最小值

結果:

   0  1   2   3
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11
輸出表格內的數據
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
輸出對列索引的倒敘排序
    3   2  1  0
0   3   2  1  0
1   7   6  5  4
2  11  10  9  8
輸出對行索引的倒敘排序
   0  1   2   3
2  8  9  10  11
1  4  5   6   7
0  0  1   2   3
對某一行的固定排序
   0  1   2   3
2  8  9  10  11
1  4  5   6   7
0  0  1   2   3
輸出表格的相關描述
         0    1     2     3
count  3.0  3.0   3.0   3.0
mean   4.0  5.0   6.0   7.0
std    4.0  4.0   4.0   4.0
min    0.0  1.0   2.0   3.0
25%    2.0  3.0   4.0   5.0
50%    4.0  5.0   6.0   7.0
75%    6.0  7.0   8.0   9.0
max    8.0  9.0  10.0  11.0

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM