替換值
replace函數
1 data=Series([1,-999,2,-999,-1000,3]) 2 3 data 4 Out[34]: 5 0 1 6 1 -999 7 2 2 8 3 -999 9 4 -1000 10 5 3 11 dtype: int64
假設-999這個值可能表示缺失數據的標記值,將其替換為pandas能理解的NA值:
1 data.replace(-999,np.nan) 2 Out[35]: 3 0 1.0 4 1 NaN 5 2 2.0 6 3 NaN 7 4 -1000.0 8 5 3.0 9 dtype: float64
一次替換多個值,可以傳入一個由待替換值組成組成的列表以及一個替換值:
data.replace([-999,-1000],np.nan) Out[36]: 0 1.0 1 NaN 2 2.0 3 NaN 4 NaN 5 3.0 dtype: float64
對不同的值進行不同的替換,傳入一個由替換關系組成的列表:
data.replace([-999,-1000],[np.nan,0]) Out[37]: 0 1.0 1 NaN 2 2.0 3 NaN 4 0.0 5 3.0 dtype: float64 #傳入的參數可以是字典 data.replace({-999:np.nan,-1000:0}) Out[38]: 0 1.0 1 NaN 2 2.0 3 NaN 4 0.0 5 3.0 dtype: float64