【pandas】文本處理：如何將相同ID的字符串進行合並

本文轉載自查看原文 2020-06-21 11:24 828 數據分析

需求：統計每個用戶下的評論，合並在一起

原評論內容有點刺激

合並后是list

再次轉為字符串，有的中間是連續兩個標點符號，這種先不管，后續清理

最后的代碼

最后源碼

df_comms_merge=df1.groupby('fromUserUid').apply(lambda x: ','.join(x['content']))

print(df_comms_merge.iloc[-1])
print(df_comms_merge.index[-1])

# 關鍵點解釋：

# groupby('fromUserUid')：需要分組的字段

# join(x['content'])])：需要合並字符串的字段

公式：df.groupby('分組字段').apply(lambda x: ','.join(x['合並字段']))

【思維拓展】：join前面可以改成自己喜歡格式，比如| + 等

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python3字符串與文本處理 PHP文本處理之中文漢字字符串轉換為數組 boost-字符文本處理 Linux文本處理 Egret 文本處理利用 NSAttributedString 進行富文本處理 Python文本處理 awk文本處理 thymeleaf文本處理 python 文本處理操作