pandas處理缺失值df.dropna( )的thresh參數


轉載自:https://www.cnblogs.com/zeng-ymzkx/p/11468912.html

df.dropna( thresh = n )

理解:這一行除去NA值,剩余數值的數量大於等於n,便顯示這一行。

import numpy as np
from numpy import nan as NA

import pandas as pd
from pandas import Series,DataFrame

df = pd.DataFrame (np.random .randn(8,7))

df.iloc[0,:] = NA
df.iloc[1,:6] = NA
df.iloc[2,:5] = NA
df.iloc[3,:4] = NA
df.iloc[4,:3] = NA
df.iloc[5,:2] = NA
df.iloc[6,0] = NA

結果:

 

 END

 

 

驗證:

(1)n=1,即剔除NA值,這些行剩余的數值數量大於等於1

df.dropna(thresh=1)

 

 END

 

(2)n=3,即剔除NA值,這些行剩余的數值數量大於等於3

df.dropna(thresh=3)

 

 END

 

 

(3)n=6,即剔除NA值,這些行剩余的數值數量大於等於6

df.dropna(thresh=6)

 

  END

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM