原文:(数据科学学习手札99)掌握pandas中的时序数据分组运算

本文示例代码及文件已上传至我的Github仓库https: github.com CNFeffery DataScienceStudyNotes 简介 我们在使用pandas分析处理时间序列数据时,经常需要对原始时间粒度下的数据,按照不同的时间粒度进行分组聚合运算,譬如基于每个交易日的股票收盘价,计算每个月的最低和最高收盘价。 而在pandas中,针对不同的应用场景,我们可以使用resample ...

2020-12-08 18:33 0 694 推荐指数:

查看详情

数据科学学习手札73)盘点pandas 1.0.0的新特性

本文对应脚本及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   毫无疑问pandas已经成为基于Python的数据分析领域最重要的包,而就在最近,pandas终于迎来了1.0.0版本 ...

Thu Jan 23 03:09:00 CST 2020 0 1109
数据科学学习手札52)pandas的ExcelWriter和ExcelFile

一、简介   pandas的ExcelFile()和ExcelWriter(),是pandas对excel表格文件进行读写相关操作非常方便快捷的类,尤其是在对含有多个sheet的excel文件进行操控时非常方便,本文就将针对这两个类的使用方法展开介绍; 二、ExcelFile ...

Thu Nov 22 22:27:00 CST 2018 6 14610
数据科学学习手札68)pandas的categorical类型及应用

一、简介   categorical是pandas对应分类变量的一种数据类型,与R的因子型变量比较相似,例如性别、血型等等用于表征类别的变量都可以用其来表示,本文就将针对categorical的相关内容及应用进行介绍。 二、创建与应用 2.1 基本特性和适用场景   在介绍 ...

Wed Sep 04 03:27:00 CST 2019 0 2127
数据科学学习手札92)利用query()与eval()优化pandas代码

本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   利用pandas进行数据分析的过程,不仅仅是计算出结果那么简单,很多初学者喜欢在计算过程创建一堆命名随心所欲的中间变量,一方 ...

Fri Aug 07 23:26:00 CST 2020 2 1047
数据科学学习手札134)pyjanitor:为pandas补充更多功能

本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   pandas发展了如此多年,所包含的功能已经覆盖了大部分数据清洗、分析场景,但仍然有着相当一部分的应用场景pandas ...

Sun Mar 13 02:56:00 CST 2022 0 971
数据科学学习手札131)pandas的常用字符串处理方法总结

本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   在日常开展数据分析的过程,我们经常需要对字符串类型数据进行处理,此类过程往往都比较繁琐,而pandas作为表格数据 ...

Sun Nov 21 23:42:00 CST 2021 0 1062
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM