利用pandas自帶的函數notnull可以很容易判斷某一列是否為null類型,但是如果這一列中某一格為空字符串“”,此時notnull函數會返回True,而一般我們選擇非空行並不包括這一點,所以需要把這一類也去掉。
# df為需要篩選的數據框,col為選擇非空依賴的列
df = df[(df[col].notnull) & (df[col] != "")]
如果數據來源是MySQL數據庫,用sql函數調用的時候也要注意相同的問題。
SELECT col
FROM table
WHERE col IS NOT NULL
AND TRIM(col) <> ''
注:TRIM函數是將去除空格。<>的效果與!=一樣。