python數據清理方面一般都會用到df.describe()這個函數,但其實這是可以傳參數的。比如以泰坦尼克號生存預測為例
df = pd.read_csv('./train.csv')
df.describe()
df.describe(include='O')
# 大寫英文字母 O
df.describe(include='all')
可以看出默認是描述數字類型的屬性,而include= “O“ 則是描述object類型的熟悉, include= ”all“則是對所有屬性的描述。
以上,對於此函數大家還有什么發現,可以和我討論哈。