pandas.merge數據連接合並


 

https://study.163.com/course/courseMain.htm?courseId=1006383008&share=2&shareId=400000000398149(博主錄制)

 

一、merge函數用途

pandas中的merge()函數類似於SQL中join的用法,可以將不同數據集依照某些字段(屬性)進行合並操作,得到一個新的數據集。

二、merge()函數的具體參數

用法:
DataFrame1.merge(DataFrame2, how=‘inner’, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=(’_x’, ‘_y’))

參數說明



how: One of ‘left’, ‘right’, ‘outer’, ‘inner’. 默認inner。
inner是取交集,outer取並集。
比如left:[‘A’,‘B’,‘C’];right[’'A,‘C’,‘D’];
inner取交集的話,left中出現的A會和right中出現的買一個A進行匹配拼接,如果沒有是B,在right中沒有匹配到,則會丟失。
'outer’取並集,出現的A會進行一一匹配,沒有同時出現的會將缺失的部分添加缺失值。


sort: 按字典順序通過連接鍵對結果DataFrame進行排序。 默認為True,設置為False將在很多情況下顯着提高性能。
suffixes: 用於重疊列的字符串后綴元組。 默認為(‘x’,’ y’)。

python腳本實例

作者郵箱 231469242@qq.com
import pandas as pd import numpy as np df1=pd.read_excel("data1.xlsx") df2=pd.read_excel("data2.xlsx") df_combine=pd.merge(df1,df2,how='inner',on='appl_no',suffixes=('_df1','_df2'))data2

data1.xlsx

data2.xlsx

combine.xlsx

 

https://study.163.com/provider/400000000398149/index.htm?share=2&shareId=400000000398149(博主視頻教學主頁)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM