python 分组统计


import pandas as pd
data1_group=data1['count_num'].groupby(data1['i_week'])
i2=data1_group.mean()
print(pd.DataFrame(i2))
print(data1_group.size())
print(data1_group.agg({'mean':'mean','sum':'sum'}))

  分组统计:将数据集data1的count_num按照i_week的数值分组计算均值

  比如count_num是每天的销售额; i_week是今天是星期几的分类变量,那么这个计算的意思就是:分别求周一周二周三周四周五周六周日的平均销售额

  

  data1_group  →将data1按照i_week分组后的数据

  i2  →周一周二周三周四周五周六周日的平均销售额

  data1_group.size()  →周一周二周三周四周五周六周日各有几天

  data1_group.agg({'MEAN':'mean','SUM':'sum'})  →周一周二周三周四周五周六周日的平均销售额和总销售额

 

后续补充:简单的分组计数

df1_gp=df1.groupby('nyr')  #将df1按照nyr字段分组
df1_gp_count=df1_gp.count()  #计算每个字段的分组计数结果,并把结果赋给df1_gp_count

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM