原文:(数据科学学习手札69)详解pandas中的map、apply、applymap、groupby、agg

从本篇开始所有文章的数据和代码都已上传至我的github仓库:https: github.com CNFeffery DataScienceStudyNotes 一 简介 pandas提供了很多方便简洁的方法,用于对单列 多列数据进行批量运算或分组聚合运算,熟悉这些方法后可极大地提升数据分析的效率,也会使得你的代码更加地优雅简洁,本文就将针对pandas中的map apply applymap ...

2019-09-05 21:59 0 2003 推荐指数:

查看详情

数据科学学习手札73)盘点pandas 1.0.0的新特性

本文对应脚本及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   毫无疑问pandas已经成为基于Python的数据分析领域最重要的包,而就在最近,pandas终于迎来了1.0.0版本 ...

Thu Jan 23 03:09:00 CST 2020 0 1109
数据科学学习手札52)pandas的ExcelWriter和ExcelFile

一、简介   pandas的ExcelFile()和ExcelWriter(),是pandas对excel表格文件进行读写相关操作非常方便快捷的类,尤其是在对含有多个sheet的excel文件进行操控时非常方便,本文就将针对这两个类的使用方法展开介绍; 二、ExcelFile ...

Thu Nov 22 22:27:00 CST 2018 6 14610
数据科学学习手札68)pandas的categorical类型及应用

一、简介   categorical是pandas对应分类变量的一种数据类型,与R的因子型变量比较相似,例如性别、血型等等用于表征类别的变量都可以用其来表示,本文就将针对categorical的相关内容及应用进行介绍。 二、创建与应用 2.1 基本特性和适用场景   在介绍 ...

Wed Sep 04 03:27:00 CST 2019 0 2127
数据科学学习手札62)详解seaborn的kdeplot、rugplot、distplot与jointplot

一、简介   seaborn是Python基于matplotlib的具有更多可视化功能和更优美绘图风格的绘图模块,当我们想要探索单个或一对数据分布上的特征时,可以使用到seaborn内置的若干函数对数据的分布进行多种多样的可视化,本文以jupyter notebook为编辑工具,针对 ...

Thu Jul 04 06:15:00 CST 2019 11 12499
数据科学学习手札99)掌握pandas的时序数据分组运算

本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   我们在使用pandas分析处理时间序列数据时,经常需要对原始时间粒度下的数据,按照不同的时间粒度进行分组聚合运算 ...

Wed Dec 09 02:33:00 CST 2020 0 694
数据科学学习手札131)pandas的常用字符串处理方法总结

本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   在日常开展数据分析的过程,我们经常需要对字符串类型数据进行处理,此类过程往往都比较繁琐,而pandas作为表格数据 ...

Sun Nov 21 23:42:00 CST 2021 0 1062
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM