pandas中na_values與keep_default_na


我們在使用pandas讀取文件時,常會遇到某個字段為NaN。

一般情況下,這時因為文件中包含空值導致的,因為pandas默認會將 

'-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/A','#N/A', 'N/A', 'NA', '#NA', 'NULL', 'NaN', '-NaN', 'nan', '-nan', ''
判定為缺失值,從而轉換為NaN。
那么如何避免DATa Frame中出現NaN呢,使用keep_default_na參數可以解決。
keep_default_na參數用來控制是否要將被判定的缺失值轉換為NaN這一過程,默認為True。,當keep_default_na=False時,源文件中出現的什么值,DataFrame中就是什么值。
 
 
下來再說na_values參數, 這個參數用來控制那些值會被判定為缺失值,它接收一個列表或者集合,當列表或者幾個中出現的字符串在文件中出現時,它也會被判定為缺失值.
但是,無論此時keep_default_na=True還是False,他都將被改寫。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM