pandas 分组后去重计数

本文转载自查看原文 2021-03-03 18:19 956 pandas

df_all.columns=['client_id', 'SalesId', 'UserIds', 'event_id', 'start_time']

#分组前把要分组的列nan,None之类的值改为其他值，pandas分组会自动过滤有nan之类的行

df_all.fillna('nan', inplace=True)

#分组计数event_id 求sum

df_groupby = df_all.groupby(['client_id', 'SalesId', 'UserIds', 'start_time'])['event_id'].nunique().reset_index()

#把'nan'转换回去
df_groupby = df_groupby.replace({'nan': None})

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 elasticsearch去重计数 MONGODB03 - 分组计数/分组去重计数（基于 spring-data-mongodb） HyperLogLog(不精确的去重计数方案) 用sql语句实现去重计数查询 pandas分组计数 Excel Wps 透视表去重计数方法 pandas分组后求和。 Java使用极小的内存完成对超大数据的去重计数，用于实时计算中统计UV pandas之去重 pandas 取 groupby 后每个分组的前 N 行