數據分析pandas之DataFrame.describe() 用法概述


DataFrame.describe(percentiles=Noneinclude=Noneexclude=None)

其物理意義在於觀察這一系列數據的范圍。大小、波動趨勢等等,便於判斷后續對數據采取哪類模型更合適。

 

 基礎數據:

# 時間
dates = pd.date_range('20200115', periods=7)
# dn表格每個維度
df = pd.DataFrame(np.random.randn(7,5),index=dates,columns=list('ABCDa'))
df.to_excel(r'D:\自動化\web\unittest\DataTest1.xls',sheet_name='Sheet1') #數據輸出至Excel

 

 

1.第一個percentiles,這個參數可以設定數值型特征的統計量,默認是[.25, .5, .75],也就是返回25%,50%,75%數據量時的數字,但是這個可以修改的,

df['Parch'].describe(percentiles=[.2,.75, .8])默認有5
 

 

 

 

2.第二個參數:include,這個參數默認是只計算數值型特征的統計量,當輸入include=['O'],會計算離散型變量的統計特征,,

舉個例子如下:

df.describe(include=‘O’)  

df.describe(include=[‘O’])  

 缺圖

df.describe(include=‘all’)  

此外傳參數是‘all’的時候會把數值型和離散型特征的統計都進行顯示。

 

 

 

 

3.第三個參數的設計就更貼心了,第二個參數是你可以指定選那些,第三個參數就是你可以指定不選哪些,人性化設計。這個參數默認不丟棄任何列,相當於無影響。

綜述,無法取指定行數,比如只取Min行 

print(df.describe().iloc[3]) 暫時只能用這種方式

 

部分內容轉https://blog.csdn.net/fang_qingyi/article/details/102649589


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM