pandas 分組后去重計數

本文轉載自查看原文 2021-03-03 18:19 956 pandas

df_all.columns=['client_id', 'SalesId', 'UserIds', 'event_id', 'start_time']

#分組前把要分組的列nan,None之類的值改為其他值，pandas分組會自動過濾有nan之類的行

df_all.fillna('nan', inplace=True)

#分組計數event_id 求sum

df_groupby = df_all.groupby(['client_id', 'SalesId', 'UserIds', 'start_time'])['event_id'].nunique().reset_index()

#把'nan'轉換回去
df_groupby = df_groupby.replace({'nan': None})

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 elasticsearch去重計數 HyperLogLog(不精確的去重計數方案) 用sql語句實現去重計數查詢 Java使用極小的內存完成對超大數據的去重計數，用於實時計算中統計UV pandas之去重 R語言分組計數 R語言分組計數【pandas】數據去重 pandas數據的分組與分列 Pandas （五）數據分組