DataFrame.
describe
(percentiles=None, include=None, exclude=None)
其物理意義在於觀察這一系列數據的范圍。大小、波動趨勢等等,便於判斷后續對數據采取哪類模型更合適。
基礎數據:
# 時間
dates = pd.date_range('20200115', periods=7)
# dn表格每個維度
df = pd.DataFrame(np.random.randn(7,5),index=dates,columns=list('ABCDa'))
df.to_excel(r'D:\自動化\web\unittest\DataTest1.xls',sheet_name='Sheet1') #數據輸出至Excel
1.第一個percentiles,這個參數可以設定數值型特征的統計量,默認是[.25, .5, .75],也就是返回25%,50%,75%數據量時的數字,但是這個可以修改的,
df['Parch'].describe(percentiles=[.2,.75, .8])默認有5
2.第二個參數:include,這個參數默認是只計算數值型特征的統計量,當輸入include=['O'],會計算離散型變量的統計特征,,
舉個例子如下:
df.describe(include=‘O’)
df.describe(include=[‘O’])
缺圖
df.describe(include=‘all’)
此外傳參數是‘all’的時候會把數值型和離散型特征的統計都進行顯示。
3.第三個參數的設計就更貼心了,第二個參數是你可以指定選那些,第三個參數就是你可以指定不選哪些,人性化設計。這個參數默認不丟棄任何列,相當於無影響。
綜述,無法取指定行數,比如只取Min行
print(df.describe().iloc[3]) 暫時只能用這種方式
部分內容轉https://blog.csdn.net/fang_qingyi/article/details/102649589