pandas中na_values与keep_default_na

本文转载自查看原文 2020-01-05 12:06 2937 Python

我们在使用pandas读取文件时，常会遇到某个字段为NaN。

一般情况下，这时因为文件中包含空值导致的，因为pandas默认会将

'-1.#IND', '1.#QNAN', '1.#IND', '-1.#QNAN', '#N/A N/A','#N/A', 'N/A', 'NA', '#NA', 'NULL', 'NaN', '-NaN', 'nan', '-nan', ''

判定为缺失值，从而转换为NaN。

那么如何避免DATa Frame中出现NaN呢，使用keep_default_na参数可以解决。

keep_default_na参数用来控制是否要将被判定的缺失值转换为NaN这一过程，默认为True。，当keep_default_na=False时，源文件中出现的什么值，DataFrame中就是什么值。

下来再说na_values参数，这个参数用来控制那些值会被判定为缺失值，它接收一个列表或者集合，当列表或者几个中出现的字符串在文件中出现时，它也会被判定为缺失值.

但是，无论此时keep_default_na=True还是False，他都将被改写。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 ValueError: cannot index with vector containing NA / NaN values R中，去掉dataframe中的NA行 java中HashMap的keySet()和values() R中如何删除全部是na的行和列 R语言数据框中，用0替代NA缺失值 Vue中keep-alive组件的理解 vue中keep-alive路由缓存 vue中的keep-alive用法详解 MySql中insert语句中value和values 细说Http中的Keep-Alive和Java Http中的Keep-Alive机制