pandas 分組后 去重計數


 

df_all.columns=['client_id', 'SalesId', 'UserIds', 'event_id', 'start_time']

#分組前把要分組的列nan,None之類的值改為其他值,pandas分組會自動過濾有nan之類的行

df_all.fillna('nan', inplace=True) 

#分組 計數event_id 求sum

df_groupby = df_all.groupby(['client_id', 'SalesId', 'UserIds', 'start_time'])['event_id'].nunique().reset_index()

#把'nan'轉換回去
df_groupby = df_groupby.replace({'nan': None})


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM