矢量化指的是用数组表达式代替循环来操作数组里的每个元素。 NumPy提供的通用函数(既ufunc函数)是一种对ndarray中的数据进行元素级别运算的函数。 例如,square函数计算各元素的平方,rint ...
第四章 Numpy基础:数组和矢量计算 第一部分:numpy的ndarray:一种多维数组对象 实话说,用numpy的主要目的在于应用矢量化运算。Numpy并没有多么高级的数据分析功能,理解Numpy和面向数组的计算能有助于理解后面的pandas.按照课本的说法,作者关心的功能主要集中于: 用于数据整理和清理 子集构造和过滤 转换等快速的矢量化运算 常用的数组解法,如排序 唯一化 集合运算等 高效 ...
2015-11-27 11:24 0 3763 推荐指数:
矢量化指的是用数组表达式代替循环来操作数组里的每个元素。 NumPy提供的通用函数(既ufunc函数)是一种对ndarray中的数据进行元素级别运算的函数。 例如,square函数计算各元素的平方,rint ...
NumPy(Numerical Python的简称)是Python数值计算最重要的基础包。大多数提供科学计算的包都是用NumPy的数组作为构建基础。 NumPy的部分功能如下: ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。 用于对整组数据进行快速运算 ...
pandas是本书后续内容的首选库。pandas可以满足以下需求: 具备按轴自动或显式数据对齐功能的数据结构。这可以防止许多由于数据未对齐以及来自不同数据源(索引方式不同)的数据而导致的常见错误。. 集成时间序列功能 既能 ...
第一章 准备工作 今天开始码这本书--《利用python进行数据分析》。R和python都得会用才行,这是码这本书的原因。首先按照书上说的进行安装,google下载了epd_free-7.3-1-win-x86.msi,译者建议按照作者的版本安装,EPDFree包括了Numpy,Scipy ...
http://www.cnblogs.com/batteryhp/p/5046450.html 对数据进行分组并对各组应用一个函数,是数据分析的重要环节。数据准备好之后,通常的任务就是计算分组统计或生成透视表。groupby函数能高效处理数据,对数据进行切片、切块、摘要等操作。可以看出 ...
输入输出一般分为下面几类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据。利用Web API操作网络资源。 1、读写文本格式的数据 自己感觉读写文件有时候“需要运气”,经常需要手工调整。因为其简单的文件交互语法、直观的数据结构,以及诸如元组打包解包之类的便利功能,Python在文本 ...
第三节中的四个示例。(ps:新开一篇是为了展现对例子的重视。) 3.1用特定于分组的值填充缺失值 对于缺失值的清理工作,可以用dropna进行删除,有时候需要进行填充(或者平滑化)。这时候用的是fillna。 0 -0.3114181 -0.0543052 ...
5、时期及其算数运算 时期(period)表示的是时间区间,比如数日、数月、数季、数年等。Period类所表示的就是这种数据类型,其构造函数需要用到一个字符串或整数,以及频率。 array([126, 129, 132], dtype=int64)[Finished ...