https://study.163.com/course/courseMain.htm?courseId=1006383008&share=2&shareId=400000000398149(博主錄制)
一、merge函數用途
pandas中的merge()函數類似於SQL中join的用法,可以將不同數據集依照某些字段(屬性)進行合並操作,得到一個新的數據集。
二、merge()函數的具體參數
用法:
DataFrame1.merge(DataFrame2, how=‘inner’, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=(’_x’, ‘_y’))
參數說明

how: One of ‘left’, ‘right’, ‘outer’, ‘inner’. 默認inner。
inner是取交集,outer取並集。
比如left:[‘A’,‘B’,‘C’];right[’'A,‘C’,‘D’];
inner取交集的話,left中出現的A會和right中出現的買一個A進行匹配拼接,如果沒有是B,在right中沒有匹配到,則會丟失。
'outer’取並集,出現的A會進行一一匹配,沒有同時出現的會將缺失的部分添加缺失值。
sort: 按字典順序通過連接鍵對結果DataFrame進行排序。 默認為True,設置為False將在很多情況下顯着提高性能。
suffixes: 用於重疊列的字符串后綴元組。 默認為(‘x’,’ y’)。
python腳本實例
作者郵箱 231469242@qq.com
import pandas as pd import numpy as np df1=pd.read_excel("data1.xlsx") df2=pd.read_excel("data2.xlsx") df_combine=pd.merge(df1,df2,how='inner',on='appl_no',suffixes=('_df1','_df2'))data2
data1.xlsx

data2.xlsx

combine.xlsx

https://study.163.com/provider/400000000398149/index.htm?share=2&shareId=400000000398149(博主視頻教學主頁)


