我們在使用pandas讀取文件時,常會遇到某個字段為NaN。
一般情況下,這時因為文件中包含空值導致的,因為pandas默認會將
'-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/A','#N/A', 'N/A', 'NA', '#NA', 'NULL', 'NaN', '-NaN', 'nan', '-nan', ''
判定為缺失值,從而轉換為NaN。
那么如何避免DATa Frame中出現NaN呢,使用keep_default_na參數可以解決。
keep_default_na參數用來控制是否要將被判定的缺失值轉換為NaN這一過程,默認為True。,當keep_default_na=False時,源文件中出現的什么值,DataFrame中就是什么值。
下來再說na_values參數, 這個參數用來控制那些值會被判定為缺失值,它接收一個列表或者集合,當列表或者幾個中出現的字符串在文件中出現時,它也會被判定為缺失值.
但是,無論此時keep_default_na=True還是False,他都將被改寫。
