原文:(数据科学学习手札131)pandas中的常用字符串处理方法总结

本文示例代码及文件已上传至我的Github仓库https: github.com CNFeffery DataScienceStudyNotes 简介 在日常开展数据分析的过程中,我们经常需要对字符串类型数据进行处理,此类过程往往都比较繁琐,而pandas作为表格数据分析利器,其内置的基于Series.str访问器的诸多针对字符串进行处理的方法,以及一些top level级的内置函数,则可以帮助 ...

2021-11-21 15:42 0 1062 推荐指数:

查看详情

数据科学学习手札73)盘点pandas 1.0.0的新特性

本文对应脚本及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   毫无疑问pandas已经成为基于Python的数据分析领域最重要的包,而就在最近,pandas终于迎来了1.0.0版本 ...

Thu Jan 23 03:09:00 CST 2020 0 1109
数据科学学习手札52)pandas的ExcelWriter和ExcelFile

一、简介   pandas的ExcelFile()和ExcelWriter(),是pandas对excel表格文件进行读写相关操作非常方便快捷的类,尤其是在对含有多个sheet的excel文件进行操控时非常方便,本文就将针对这两个类的使用方法展开介绍; 二、ExcelFile ...

Thu Nov 22 22:27:00 CST 2018 6 14610
数据科学学习手札97)掌握pandas的transform

本文示例文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   开门见山,在pandas,transform是一类非常实用的方法,通过它我们可以很方便地将某个或某些函数处理过程(非聚合)作用 ...

Thu Oct 15 05:06:00 CST 2020 0 808
数据科学学习手札58)在R处理有缺失值数据的高级方法

一、简介   在实际工作,遇到数据带有缺失值是非常常见的现象,简单粗暴的做法如直接删除包含缺失值的记录、删除缺失值比例过大的变量、用0填充缺失值等,但这些做法会很大程度上影响原始数据的分布或者浪费来之不易的数据信息,因此怎样妥当地处理缺失值是一个持续活跃的领域,贡献出众多巧妙的方法,在不浪费 ...

Thu May 30 05:56:00 CST 2019 0 560
数据科学学习手札99)掌握pandas的时序数据分组运算

本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   我们在使用pandas分析处理时间序列数据时,经常需要对原始时间粒度下的数据,按照不同的时间粒度进行分组聚合运算 ...

Wed Dec 09 02:33:00 CST 2020 0 694
数据科学学习手札92)利用query()与eval()优化pandas代码

本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介   利用pandas进行数据分析的过程,不仅仅是计算出结果那么简单,很多初学者喜欢在计算过程创建一堆命名随心所欲的中间变量,一方 ...

Fri Aug 07 23:26:00 CST 2020 2 1047
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM