merge

pandas的merge方法提供了一種類似於SQL的內存鏈接操作，官網文檔提到它的性能會比其他開源語言的數據操作（例如R）要高效。

merge的參數

on：列名，join用來對齊的那一列的名字，用到這個參數的時候一定要保證左表和右表用來對齊的那一列都有相同的列名。

how：數據融合的方法。

實際案例，從各省爬取到的葯品數據從全國中標葯品數據庫中匹配出國家准字號。

result = pd.merge(df1,df2,how="left",on=["drugName","specification","manufacturerName"])
result = result.dropna(how="any")

1.1 復合key的合並方法

使用merge的時候可以選擇多個key作為復合可以來對齊合並。

result = pd.merge(left, right, on=['key1', 'key2'])

這里寫圖片描述
沒有指定how的話默認使用inner方法。

how的方法有：

只保留左表的所有數據

result = pd.merge(left, right, how='left', on=['key1', 'key2'])

這里寫圖片描述

只保留右表的所有數據

result = pd.merge(left, right, how='right', on=['key1', 'key2'])

這里寫圖片描述

保留兩個表的所有信息

result = pd.merge(left, right, how='outer', on=['key1', 'key2'])

這里寫圖片描述

只保留兩個表中公共部分的信息

result = pd.merge(left, right, how='inner', on=['key1', 'key2'])

這里寫圖片描述

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Pandas 合並merge pandas的merge函數 Pandas concat和merge合並 pandas之DataFrame合並merge pandas.DataFrame.merge pandas中merge的使用 Python Pandas Merge, join and concatenate Pandas中merge和join的區別 Pandas 基礎(9) - 組合方法 merge pandas中join和merge的用法