花费 18 ms
数据分析第四篇:数据清洗

需要清洗的数据有下面几种形式 2.1错误值 出现大量0的话,可以使用缺失值替代,然后再用缺失值填补的方法处理 camp['AvgIncome']=camp['AvgIncome'].r ...

Fri Oct 20 19:01:00 CST 2017 4 58386
Kettle日常使用汇总整理

Kettle日常使用汇总整理 Kettle源码下载地址: https://github.com/pentaho/pentaho-kettle Kettle软件下载地址: https://sou ...

Thu Jan 11 22:41:00 CST 2018 3 22694
[数据清洗]- Pandas 清洗“脏”数据(二)

概要 了解数据 分析数据问题 清洗数据 整合代码 了解数据 在处理任何数据之前,我们的第一任务是理解数据以及数据是干什么用的。我们尝试去理解数据的列/行、记录、数据格式、语 ...

Thu Jan 04 15:20:00 CST 2018 1 13010
Python中识别DataFrame中的nan

# 识别python中DataFrame中的nanfor i in pfsj.index:   if type(pfsj.loc[i]['WZML']) == float:     print('fl ...

Sun Jun 24 18:44:00 CST 2018 0 10265
Python中DataFrame去重

# 去除重复行数据 keep:'first':保留重复行的第一行,'last':保留重复行的最后一行,False:删除所有重复行df = df.drop_duplicates(   subset=[ ...

Wed Jun 27 01:48:00 CST 2018 0 7030
python——re模块(正则表达式)

re 模块的使用: 1.使用compile()函数编译一个parttern对象, 例如:parttern=re.compile(r'\d+') 2.通过pattern对象提供的一系列属相和方法, ...

Wed Dec 05 01:25:00 CST 2018 0 4618
Python数据清洗基本流程

# -*- coding: utf-8 -*-"""Created on Wed Jul 4 18:40:55 2018 @author: zhen""" import pandas as pdi ...

Thu Jul 05 18:17:00 CST 2018 0 5241

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM