原文:Python机器学习(八十七)Pandas 去除重复

去除重复数据是一项常见操作,Pandas中,可以使用drop duplicates方法。 电影数据集没有重复的行,我们来制造一些重复行。 输出 append 将返回一个副本,不影响原始数据DataFrame。使用.shape属性查看形状,可以看到数据增加了一倍。 接下来删除重复数据: 输出 与append 一样,此处drop duplicate 方法也将返回副本。 如果想直接在原数据上修改,可以指 ...

2020-06-21 21:17 0 1373 推荐指数:

查看详情

Python机器学习八十九)Pandas 整理列名

关于数据集的列名,通常建议最好使用小写字母,删除特殊字符,并用下划线替换空格。有时数据集的列名可能不是很规范,需要整理修改理列名。 获取DataFrame的列名 获取DataFrame的列名,可以 ...

Mon Jun 22 05:20:00 CST 2020 0 571
Python机器学习八十三)Pandas 读取 SQL 数据库

要从SQL数据库中加载数据,可以使用Pandas的read_sql_query方法。 我们将使用sqlite来测演示。 首先安装python的sqlite驱动 pysqlite3: pysqlite3用于创建数据库连接,然后使用SELECT查询数据,加载DataFrame ...

Mon Jun 22 05:07:00 CST 2020 0 2659
Python机器学习八十五)Pandas 用head与tail查看数据

Pandas可以对数据集进行各种有用的分析和操作。让我们先从最简单的查看数据开始。 我们将使用IMDB电影数据集来演示,数据集文件下载:IMDB-Movie-Data.csv 首先加载CSV数据集,并将电影标题Title指定为索引。 head 打开新数据集时,通常要做的第一件 ...

Mon Jun 22 05:11:00 CST 2020 0 2445
Python机器学习八十六)Pandas 数据集信息

info 使用.info方法,可以查看数据集的基本信息: 输出 上面的输出信息中,包含了行和列的数量、非空值的数量、每个列中的数据类型以及DataFrame数据使用了 ...

Mon Jun 22 05:14:00 CST 2020 0 512
Python机器学习(九十)Pandas 去除null值

数据集中通常会包含null值或空值,对于空值的处理有2种方式: 删除带有null的行或列 用非空值填充null项 检查null值 要处理数据集中的null值,首先要找出DataFr ...

Mon Jun 22 05:23:00 CST 2020 0 3174
Python机器学习八十二)Pandas 读取 CSV 数据

将各种文件格式的数据加载到DataFrame中非常简单。 CSV文件只需要一行代码就可以加载数据。 例如,假设我们的CSV文件内容如下: 在Excel中打开: Pandas加载CSV为DataFrame: 输出 csv ...

Mon Jun 22 05:02:00 CST 2020 0 669
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM