【pandas】文本處理:如何將相同ID的字符串進行合並


需求:統計每個用戶下的評論,合並在一起

原評論 內容有點刺激

 

合並后是list

 

 再次轉為字符串,有的中間是連續兩個標點符號,這種先不管,后續清理

 

 最后的代碼

 

 最后源碼

df_comms_merge=df1.groupby('fromUserUid').apply(lambda x: ','.join(x['content']))

print(df_comms_merge.iloc[-1]) print(df_comms_merge.index[-1])

  # 關鍵點解釋:

# groupby('fromUserUid'):需要分組的字段
# join(x['content'])]):需要合並字符串的字段
 
        

公式:df.groupby('分組字段').apply(lambda x: ','.join(x['合並字段']))

【 思維拓展 】:join前面可以改成自己喜歡格式,比如| + 等

 

資料參考:https://blog.csdn.net/qq_32618817/article/details/80430841


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM