import pandas as pd data1_group=data1['count_num'].groupby(data1['i_week']) i2=data1_group.mean() print(pd.DataFrame(i2)) print(data1_group.size()) print(data1_group.agg({'mean':'mean','sum':'sum'}))
分組統計:將數據集data1的count_num按照i_week的數值分組計算均值
比如count_num是每天的銷售額; i_week是今天是星期幾的分類變量,那么這個計算的意思就是:分別求周一周二周三周四周五周六周日的平均銷售額
data1_group →將data1按照i_week分組后的數據
i2 →周一周二周三周四周五周六周日的平均銷售額
data1_group.size() →周一周二周三周四周五周六周日各有幾天
data1_group.agg({'MEAN':'mean','SUM':'sum'}) →周一周二周三周四周五周六周日的平均銷售額和總銷售額
后續補充:簡單的分組計數
df1_gp=df1.groupby('nyr') #將df1按照nyr字段分組
df1_gp_count=df1_gp.count() #計算每個字段的分組計數結果,並把結果賦給df1_gp_count