pandas-resample按時間聚合


import pandas as pd

#如果需要的話,需將df中的date列轉為datetime

df.date = pd.to_datetime(df.date,format="%Y%m%d")

#將改好格式的date列,設置為df的index

df.set_index('date',drop=True)

 

#按年來提數據  (因為此時的datetime已經為index了,可以直接[]取行內容)

df['2018']

df['2018':'2021']

#按月來提數據

df['2018-01']

df['2018-01':'2018-05']

#按天來提出數據

df['2018-05-24':'2018-09-27']

 

#按日期匯總數據

#將數據以W星期,M月,Q季度,QS季度的開始第一天開始,A年,10A十年,10AS十年聚合日期第一天開始.的形式進行聚合

df.resample('W').sum()

df.resample('M').sum()

 

#具體某列的數據聚合

df.price.resample('W').sum().fillna(0)   #星期聚合,以0填充NaN值

#某兩列

df[['price','num']].resample('W').sum().fillna(0)

#某個時間段內,以W聚合,

df["2018-5":"2018-9"].resample("M").sum().fillna(0)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM