内容目录 1. 创建对象 2. 常用操作 3. 内存使用量的陷阱 一、创建对象 1.基本概念:分类数据直白来说就是取值为有限的,或者说是固定数量的可能值。例如:性别、血型。 2.创建分类数据:这里以血型为例,假定每个用户有以下的血型,我们如何创建一个关于血型的分类 ...
分类 Category 数据:直白来说,就是取值为有限的,或者说是固定数量的可能值。例如:性别 血型 指定数据类型构建分类数据 dtype category 以血型为例,创建一个关于血型的分类对象 使用 pd.Categorical 来构建分类数据 转为分类数据 我们经常遇到的情况是已经创建了一个 Series,如何将它转为分类数据呢 来看看astype用法吧 常用操作 .describe 可以 ...
2019-11-06 11:03 2 3079 推荐指数:
内容目录 1. 创建对象 2. 常用操作 3. 内存使用量的陷阱 一、创建对象 1.基本概念:分类数据直白来说就是取值为有限的,或者说是固定数量的可能值。例如:性别、血型。 2.创建分类数据:这里以血型为例,假定每个用户有以下的血型,我们如何创建一个关于血型的分类 ...
目录 删除重复元素 (duplicated) 映射 (replace) Series替换操作 DataFrame替换操作 map函数 使用聚合操作对数据异常值检测和过滤 排序 数据分类处理 (重点) 分组 ...
一、分类数据的概念 1、什么是分类数据 分类数据(Category Data)是指Pandas数据类型为分类类型的数据 分类数据是由固定的且数量有限的变量组成,通常是字符串。例如: 性别:男、女 血型:A型、B型、C型 国家:中国、美国 ...
数据丢失(缺失)在现实生活中总是一个问题。 机器学习和数据挖掘等领域由于数据缺失导致的数据质量差,在模型预测的准确性上面临着严重的问题。 在这些领域,缺失值处理是使模型更加准确和有效的重点。 使用重构索引(reindexing),创建了一个缺少值的DataFrame。 在输出中,NaN表示 ...
1、pandas对缺失数据的处理 我们的数据缺失通常有两种情况: 1、一种就是空,None等,在pandas是NaN(和np.nan一样) 解决方法: 判断数据是否为NaN:pd.isnull(df),pd.notnull(df) 处理 ...
pandas是基于numpy包扩展而来的,因而numpy的绝大多数方法在pandas中都能适用。 pandas中我们要熟悉两个数据结构Series 和DataFrame Series是类似于数组的对象,它有一组数据和与之相关的标签组成。 import pandas as pd ...