df_all.columns=[
'client_id'
,
'SalesId'
,
'UserIds'
,
'event_id'
,
'start_time'
]
#分組前把要分組的列nan,None之類的值改為其他值,pandas分組會自動過濾有nan之類的行
df_all.fillna('nan', inplace=True)
#分組 計數event_id 求sum
df_groupby = df_all.groupby(['client_id', 'SalesId', 'UserIds', 'start_time'])['event_id'].nunique().reset_index()
#把'nan'轉換回去
df_groupby = df_groupby.replace({'nan': None})