DataFrame的基礎功能,以后要查詢就得看這里!
功能清單
df2.index df2.columns df2.axes df2.T df2.info() df2.head(i) df2.tail(i) df2.describe()
首先隨機創建一個DataFrame
# 利用 numpy 的隨機函數建立一個 DataFrame df = DataFrame(np.random.rand(50,5))
運行結果
是5行50列的一個二維數組

這里為了加深印象,我添加了一個字典,增加對比,如下
data = {'state':['Ohino','Ohino','Ohino','Nevada','Nevada'], 'year':[2000,2001,2002,2001,2002], 'pop':[1.5,1.7,3.6,2.4,2.9]} dic_df = DataFrame(data,index=['one','two','three','four','five'], columns=['year','state','pop','debt']) print(df)
運行結果
重點來了,以后查的時候就用下邊
df.index
求行
df.index
dic_df.index
df運行結果
RangeIndex(start=0, stop=50, step=1) #意思是從0開始,50結束,步長為1
dic_df的運行結果
Index(['one', 'two', 'three', 'four', 'five'], dtype='object')
df.columns
求列
print(df.columns) print(dic_df.columns)
運行結果
df.axes
print(df.axes) print(dic_df.axes)
運行結果
就是返回兩個“邊”。
df.T
index 跟 columns 對調
print(dic_df) print(dic_df.T)
運行結果
df.info()
打印二維數組的信息
print(df.info()) print('\n') print(dic_df.info()
運行結果
這里顯示的信息都是以列為單位(columns)
df.head(i)
顯示前頭幾行數據,以行為單位,index
print(df.head(4)) print('\n') print(dic_df.head(2))
運行結果
df.tail(i)
從后頭顯示幾條信息
print(df.tail(4)) print('\n') print(dic_df.tail(1))
運行結果
df.describe()
查看數據值列的匯總統計
可返回變量和觀測的數量、缺失值和唯一值的數目、平均值、分位數等相關信息
print(dic_df.describe().T) print('\n') print(dic_df.describe())
運行結果