1.創建帶有缺失值的數據庫:
import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three']) # 隨機產生5行3列的數據 df.ix[1, :-1] = np.nan # 將指定數據定義為缺失 df.ix[1:-1, 2] = np.nan print('\ndf1') # 輸出df1,然后換行 print(df)
查看數據內容:
2.通常情況下刪除行,使用參數axis = 0,刪除列的參數axis = 1,通常不會這么做,那樣會刪除一個變量。
print('\ndrop row') print(df.dropna(axis = 0))
刪除后結果: