df_all.columns=[
'client_id'
,
'SalesId'
,
'UserIds'
,
'event_id'
,
'start_time'
]
#分组前把要分组的列nan,None之类的值改为其他值,pandas分组会自动过滤有nan之类的行
df_all.fillna('nan', inplace=True)
#分组 计数event_id 求sum
df_groupby = df_all.groupby(['client_id', 'SalesId', 'UserIds', 'start_time'])['event_id'].nunique().reset_index()
#把'nan'转换回去
df_groupby = df_groupby.replace({'nan': None})