pandas 分组后 去重计数


 

df_all.columns=['client_id', 'SalesId', 'UserIds', 'event_id', 'start_time']

#分组前把要分组的列nan,None之类的值改为其他值,pandas分组会自动过滤有nan之类的行

df_all.fillna('nan', inplace=True) 

#分组 计数event_id 求sum

df_groupby = df_all.groupby(['client_id', 'SalesId', 'UserIds', 'start_time'])['event_id'].nunique().reset_index()

#把'nan'转换回去
df_groupby = df_groupby.replace({'nan': None})


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM