【pandas】文本处理:如何将相同ID的字符串进行合并


需求:统计每个用户下的评论,合并在一起

原评论 内容有点刺激

 

合并后是list

 

 再次转为字符串,有的中间是连续两个标点符号,这种先不管,后续清理

 

 最后的代码

 

 最后源码

df_comms_merge=df1.groupby('fromUserUid').apply(lambda x: ','.join(x['content']))

print(df_comms_merge.iloc[-1]) print(df_comms_merge.index[-1])

  # 关键点解释:

# groupby('fromUserUid'):需要分组的字段
# join(x['content'])]):需要合并字符串的字段
 

公式:df.groupby('分组字段').apply(lambda x: ','.join(x['合并字段']))

【 思维拓展 】:join前面可以改成自己喜欢格式,比如| + 等

 

资料参考:https://blog.csdn.net/qq_32618817/article/details/80430841


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM