教你如何用 Python 合並多個 excel


安裝模塊

1、找到對應的模塊  http://www.python-excel.org/

2、用 pip install 安裝

pip3 install xlrd
pip3 install XlsxWriter

因為使用的是 python3,所以安裝的時候采用 pip3。

XlsxWriter 示例

先看看簡單的演示:

import xlsxwriter

# 創建一個工作簿並添加一個工作表
workbook = xlsxwriter.Workbook("c.xlsx")
worksheet = workbook.add_worksheet()

# 設置列寬
worksheet.set_column("A:A", 20)

# 設置格式
bold = workbook.add_format({"bold": True})

# 設置單元格的值
worksheet.write("A1", "Hello")

# 帶格式的單元格
worksheet.write("A2", "World")

# 寫一些數字,用行列標識
worksheet.write(2, 0, 123)
worksheet.write(3, 0, 123.456, bold)

# 插入一張圖片
worksheet.insert_image("B5", "s.png")

# 關閉文件流
workbook.close()

運行結果如下:

 

合並Excel數據

對於合並 excel,有兩種 case ,一種是表頭都是一樣的,一種是表頭不一樣的excel ,但是希望放到同一個表格里面,方便查看

表頭都一樣的 excel

這個處理很簡單,具體代碼如下:

import xlrd
import xlsxwriter

source_xls = ["a.xlsx", "b.xlsx"]
target_xls = "3.xlsx"

# 讀取數據
data = []
for i in c:
    wb = xlrd.open_workbook(i)
    for sheet in wb.sheets():
        for rownum in range(sheet.nrows):
            data.append(sheet.row_values(rownum))
print(data)
# 寫入數據
workbook = xlsxwriter.Workbook(target_xls)
worksheet = workbook.add_worksheet()
font = workbook.add_format({"font_size": 14})
for i in range(len(data)):
    for j in range(len(data[i])):
        worksheet.write(i, j, data[i][j], font)
# 關閉文件流
workbook.close()

Excel 是由行和列組成的,所以這里將所有文件中的所有 sheet 中的數據讀取出來組成一個二維數組,然后再寫入新的 Excel。

表頭都不一樣的 excel

對於表頭不一樣的 excel,可能需要手動選取表格的一部分,然后進行合並。具體代碼如下:

import xlrd
import xlsxwriter

source_xls = ["a.xlsx", "b.xlsx"]
target_xls = "合並.xlsx"

# 讀取數據
data = []
# 重復數據
dupdata = []
# 姓名列表,按照姓名去重
name = []
# 獲取excel的個數
sheetcount = len(source_xls)
i = 0
while i < len(source_xls):
    wb = xlrd.open_workbook(source_xls[i])
    # 存儲不同excel 的數據
    data.append([])
    # 一個excel 可能存在多張表格
    for sheet in wb.sheets():
        if i == 0:
            # 先把表頭添加進去
            dupdata.append(sheet.row_values(0))
        for rownum in range(sheet.nrows):
            # 判斷名字是否重復,表頭都是姓名開頭的,所以把姓名除去
            if (sheet.row_values(rownum)[0] in name):
                dupdata.append(sheet.row_values(rownum))
                # 給數據添加另一個表的表頭
                if (sheet.row_values(rownum)[0] == '姓名'):
                    data[i].append(sheet.row_values(rownum))
            else:
                name.append(sheet.row_values(rownum)[0])
                data[i].append(sheet.row_values(rownum))
    i+=1

# 合並數據
workbook = xlsxwriter.Workbook(target_xls)
worksheet = workbook.add_worksheet()
font = workbook.add_format({"font_size": 14})
lineNum = 0
for num in range(len(data)):
    # 區分來自不同excel 的數據
    if num== 0 :
        for i in range(len(data[num])):
            # 姓名
            worksheet.write(lineNum, 0, data[num][i][0], font)
            # 檢查編號
            worksheet.write(lineNum, 1, data[num][i][1], font)
            # 年齡
            worksheet.write(lineNum, 2, data[num][i][23], font)
            # 藍標
            worksheet.write(lineNum, 3, data[num][i][14], font)
            # 黃標
            worksheet.write(lineNum, 4, data[num][i][19], font)
            worksheet.write(lineNum, 5, data[num][i][20], font)
            worksheet.write(lineNum, 6, data[num][i][21], font)
            # 大小
            worksheet.write(lineNum, 7, data[num][i][24], font)
            worksheet.write(lineNum, 8, data[num][i][25], font)
            worksheet.write(lineNum, 9, data[num][i][26], font)
        
            lineNum += 1
    # 只有兩個excel ,所以直接用了 else 
    else:
        for i in range(len(data[num])):
            lineNum += 1
            # 姓名
            worksheet.write(lineNum, 0, data[num][i][0], font)
            # 檢查編號
            worksheet.write(lineNum, 1, data[num][i][1], font)
            # 年齡
            worksheet.write(lineNum, 2, data[num][i][2], font)
            # 藍標
            worksheet.write(lineNum, 3, data[num][i][30], font)
# 關閉文件流
workbook.close()

# 針對重復數據,連表頭一起輸出,方便后續回顧查看
workbook = xlsxwriter.Workbook("重復.xlsx")
worksheet = workbook.add_worksheet()
font = workbook.add_format({"font_size": 14})
for i in range(len(dupdata)):
    for j in range(len(dupdata[i])):
        worksheet.write(i, j, dupdata[i][j], font)
# 關閉文件流
workbook.close() 

合並后的結果

 重復列表結果如下:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM