原文:(數據科學學習手札131)pandas中的常用字符串處理方法總結

本文示例代碼及文件已上傳至我的Github倉庫https: github.com CNFeffery DataScienceStudyNotes 簡介 在日常開展數據分析的過程中,我們經常需要對字符串類型數據進行處理,此類過程往往都比較繁瑣,而pandas作為表格數據分析利器,其內置的基於Series.str訪問器的諸多針對字符串進行處理的方法,以及一些top level級的內置函數,則可以幫助 ...

2021-11-21 15:42 0 1062 推薦指數:

查看詳情

數據科學學習手札73)盤點pandas 1.0.0的新特性

本文對應腳本及數據已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介   毫無疑問pandas已經成為基於Python的數據分析領域最重要的包,而就在最近,pandas終於迎來了1.0.0版本 ...

Thu Jan 23 03:09:00 CST 2020 0 1109
數據科學學習手札52)pandas的ExcelWriter和ExcelFile

一、簡介   pandas的ExcelFile()和ExcelWriter(),是pandas對excel表格文件進行讀寫相關操作非常方便快捷的類,尤其是在對含有多個sheet的excel文件進行操控時非常方便,本文就將針對這兩個類的使用方法展開介紹; 二、ExcelFile ...

Thu Nov 22 22:27:00 CST 2018 6 14610
數據科學學習手札97)掌握pandas的transform

本文示例文件已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介   開門見山,在pandas,transform是一類非常實用的方法,通過它我們可以很方便地將某個或某些函數處理過程(非聚合)作用 ...

Thu Oct 15 05:06:00 CST 2020 0 808
數據科學學習手札58)在R處理有缺失值數據的高級方法

一、簡介   在實際工作,遇到數據帶有缺失值是非常常見的現象,簡單粗暴的做法如直接刪除包含缺失值的記錄、刪除缺失值比例過大的變量、用0填充缺失值等,但這些做法會很大程度上影響原始數據的分布或者浪費來之不易的數據信息,因此怎樣妥當地處理缺失值是一個持續活躍的領域,貢獻出眾多巧妙的方法,在不浪費 ...

Thu May 30 05:56:00 CST 2019 0 560
數據科學學習手札99)掌握pandas的時序數據分組運算

本文示例代碼及文件已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介   我們在使用pandas分析處理時間序列數據時,經常需要對原始時間粒度下的數據,按照不同的時間粒度進行分組聚合運算 ...

Wed Dec 09 02:33:00 CST 2020 0 694
數據科學學習手札92)利用query()與eval()優化pandas代碼

本文示例代碼已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介   利用pandas進行數據分析的過程,不僅僅是計算出結果那么簡單,很多初學者喜歡在計算過程創建一堆命名隨心所欲的中間變量,一方 ...

Fri Aug 07 23:26:00 CST 2020 2 1047
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM