concat方法相当于数据库中的全连接(UNION ALL),可以指定按某个轴进行连接,也可以指定连接的方式join(outer,inner 只有这两种)。
与数据库不同的是concat不会去重,要达到去重的效果可以使用drop_duplicates方法
concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True):
————————————————
from pandas import Series,DataFrame,concat df1 = DataFrame({'city': ['Chicago', 'San Francisco', 'New York City'], 'rank': range(1, 4)}) df2 = DataFrame({'city': ['Chicago', 'Boston', 'Los Angeles'], 'rank': [1, 4, 5]}) print '按轴进行内连接\r\n',concat([df1,df2],join="inner",axis=1) print '进行外连接并指定keys(行索引)\r\n',concat([df1,df2],keys=['a','b']) #这里有重复的数据 print '去重后\r\n',concat([df1,df2],ignore_index=True).drop_duplicates() 按轴进行内连接 city rank city rank Chicago 1 Chicago 1 San Francisco 2 Boston 4 New York City 3 Los Angeles 5 进行外连接并指定keys(行索引) city rank a Chicago 1 San Francisco 2 New York City 3 b Chicago 1 Boston 4 Los Angeles 5 去重后 city rank 0 Chicago 1 1 San Francisco 2 2 New York City 3 4 Boston 4 5 Los Angeles 5
https://blog.csdn.net/qq_31798135/article/details/102652821