原文:(數據科學學習手札69)詳解pandas中的map、apply、applymap、groupby、agg

從本篇開始所有文章的數據和代碼都已上傳至我的github倉庫:https: github.com CNFeffery DataScienceStudyNotes 一 簡介 pandas提供了很多方便簡潔的方法,用於對單列 多列數據進行批量運算或分組聚合運算,熟悉這些方法后可極大地提升數據分析的效率,也會使得你的代碼更加地優雅簡潔,本文就將針對pandas中的map apply applymap ...

2019-09-05 21:59 0 2003 推薦指數:

查看詳情

數據科學學習手札73)盤點pandas 1.0.0的新特性

本文對應腳本及數據已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介   毫無疑問pandas已經成為基於Python的數據分析領域最重要的包,而就在最近,pandas終於迎來了1.0.0版本 ...

Thu Jan 23 03:09:00 CST 2020 0 1109
數據科學學習手札52)pandas的ExcelWriter和ExcelFile

一、簡介   pandas的ExcelFile()和ExcelWriter(),是pandas對excel表格文件進行讀寫相關操作非常方便快捷的類,尤其是在對含有多個sheet的excel文件進行操控時非常方便,本文就將針對這兩個類的使用方法展開介紹; 二、ExcelFile ...

Thu Nov 22 22:27:00 CST 2018 6 14610
數據科學學習手札68)pandas的categorical類型及應用

一、簡介   categorical是pandas對應分類變量的一種數據類型,與R的因子型變量比較相似,例如性別、血型等等用於表征類別的變量都可以用其來表示,本文就將針對categorical的相關內容及應用進行介紹。 二、創建與應用 2.1 基本特性和適用場景   在介紹 ...

Wed Sep 04 03:27:00 CST 2019 0 2127
數據科學學習手札62)詳解seaborn的kdeplot、rugplot、distplot與jointplot

一、簡介   seaborn是Python基於matplotlib的具有更多可視化功能和更優美繪圖風格的繪圖模塊,當我們想要探索單個或一對數據分布上的特征時,可以使用到seaborn內置的若干函數對數據的分布進行多種多樣的可視化,本文以jupyter notebook為編輯工具,針對 ...

Thu Jul 04 06:15:00 CST 2019 11 12499
數據科學學習手札99)掌握pandas的時序數據分組運算

本文示例代碼及文件已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介   我們在使用pandas分析處理時間序列數據時,經常需要對原始時間粒度下的數據,按照不同的時間粒度進行分組聚合運算 ...

Wed Dec 09 02:33:00 CST 2020 0 694
數據科學學習手札131)pandas的常用字符串處理方法總結

本文示例代碼及文件已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介   在日常開展數據分析的過程,我們經常需要對字符串類型數據進行處理,此類過程往往都比較繁瑣,而pandas作為表格數據 ...

Sun Nov 21 23:42:00 CST 2021 0 1062
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM