数据分析三剑客 numpy pandas(重点) matplotlib 重点: numpy数组的创建 numpy索引和切片 级联 变形 矩阵的乘法和转置 常见的聚合函数+统计 numpy的创建 使用np.array()创建 ...
数据操作 数据操作最重要的一步也是第一步就是收集数据,而收集数据的方式有很多种,第一种就是我们已经将数据下载到了本地,在本地通过文件进行访问,第二种就是需要到网站的API处获取数据或者网页上爬取数据,还有一种可能就是你的公司里面有自己的数据库,直接访问数据库里面的数据进行分析。需要注意的是我们不仅需要将数据收集起来还要将不同格式的数据进行整理,最后再做相应的操作。 数据导入 存储 访问数据是数据分 ...
2020-01-19 10:07 0 745 推荐指数:
数据分析三剑客 numpy pandas(重点) matplotlib 重点: numpy数组的创建 numpy索引和切片 级联 变形 矩阵的乘法和转置 常见的聚合函数+统计 numpy的创建 使用np.array()创建 ...
1、读取表中的内容,如下例子: 注意,上面read_sql方法返回的数据的类型是DataFrame 2、写入数据到表中,如下例子 说明:上面代码要求表test1不能存在 ...
DataFrame是Pandas中的一个表结构的数据结构,包括三部分信息,表头(列的名称),表的内容(二维矩阵),索引(每行一个唯一的标记)。 一、DataFrame的创建 有多种方式可以创建DataFrame,下面举例介绍。 例1: 通过list创建 上面代表,创建了一个 ...
1、pandas对缺失数据的处理 我们的数据缺失通常有两种情况: 1、一种就是空,None等,在pandas是NaN(和np.nan一样) 解决方法: 判断数据是否为NaN:pd.isnull(df),pd.notnull(df) 处理方式 ...
上一节,我们已经安装了numpy,基于numpy,我们继续来看下pandas pandas用于做数据分析与数据挖掘 pandas安装 使用命令 出现上图表示安装成功。 pandas又两大数据结构,数据分析相关的都围绕着这两种结构 ...
DataFrame DataFrame是一个表格型的数据结构,含有一组有序的列,是一个二维结构。 DataFrame可以被看做是由Series组成的字典,并且共用一个索引。 一、生成方式 可以看出 有one和two两个Series组成,并且共用一组索引 ...
一个强大的分析结构化数据的工具集 基础是NumPy,提供了高性能矩阵的运算 pandas 数据结构 Series 类似一维数组的对象 通过list构建Series ser_obj = pd.Series(range(10)) 获取数据和索引 ...
目录 一、Series数据结构 1.1 Series支持NumPy模块的特性(下标) 1.2 Series支持字典的特性(标签) 1.3 Series缺失数据处理 二、DataFrame数据结构 2.1 产生时间 ...