Python: Dataframe中的並集/合集/差集


最近要取Dataframe中的差集,順便把並集和合集一起處理了。

df1 = pd.DataFrame([[1,11,111],[2,22,222],[3,33,333]],columns=['id','data','comment'])
df2 = pd.DataFrame([[0,00,000],[1,11,111],[2,22,222],[4,44,444]],columns=['id','data','comment'])

# 取交集:既在df1中,也在df2中
intersection_result = pd.merge(df1, df2)
print(intersection_result)

# 取合集:df1和df2所有數據的集合
union_result = pd.merge(df1, df2, how='outer')
print(union_result)

#取差集 在df1中但不在df2中的
df1 = df1.append(df2)
df1 = df1.append(df2)
differenct_set_result = df1.drop_duplicates(['id'],keep=False)
print(differenct_set_result)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM