數據處理小工具:Excel 批量數據文件拆分/整合器...


需求分析:

現在有一大堆的Excel數據文件,需要根據每個Excel數據文件里面的Sheet批量將數據文件合並成為一個匯總后的Excel數據文件。或者是將一個匯總后的Excel數據文件按照Sheet拆分成很多個Excel數據文件。根據上面的需求,我們先來進行UI界面的布局設計。

【閱讀全文】

完整源代碼請滑到文章最后獲取,感謝大家的支持!

導入UI界面設計相關的PyQt5模塊

from PyQt5.QtWidgets import *

from PyQt5.QtCore import *

from PyQt5.QtGui import *

應用操作相關的模塊

import sys

import os

excel 數據處理模塊

import openpyxl as pxl

import pandas as pd

看一下 UI 界面的功能和布局,感覺還可以...

file

下面是布局相關的代碼塊實例

    def init_ui(self):
        self.setWindowTitle('Excel數據匯總/拆分器  公眾號:[Python 集中營]')
        self.setWindowIcon(QIcon('數據.ico'))

        self.brower = QTextBrowser()
        self.brower.setReadOnly(True)
        self.brower.setFont(QFont('宋體', 8))
        self.brower.setPlaceholderText('批量數據處理進度顯示區域...')
        self.brower.ensureCursorVisible()

        self.excels = QLineEdit()
        self.excels.setReadOnly(True)

        self.excels_btn = QPushButton()
        self.excels_btn.setText('加載批文件')
        self.excels_btn.clicked.connect(self.excels_btn_click)

        self.oprate_type = QLabel()
        self.oprate_type.setText('操作類型')

        self.oprate_combox = QComboBox()
        self.oprate_combox.addItems(['數據合並', '數據拆分'])

        self.data_type = QLabel()
        self.data_type.setText('合並/拆分')

        self.data_combox = QComboBox()
        self.data_combox.addItems(['按照Sheet拆分'])

        self.new_file_path = QLineEdit()
        self.new_file_path.setReadOnly(True)

        self.new_file_path_btn = QPushButton()
        self.new_file_path_btn.setText('新文件路徑')
        self.new_file_path_btn.clicked.connect(self.new_file_path_btn_click)

        self.thread_ = DataThread(self)
        self.thread_.trigger.connect(self.update_log)
        self.thread_.finished.connect(self.finished)

        self.start_btn = QPushButton()
        self.start_btn.setText('開始數據匯總/拆分')
        self.start_btn.clicked.connect(self.start_btn_click)

        form = QFormLayout()
        form.addRow(self.excels, self.excels_btn)
        form.addRow(self.oprate_type, self.oprate_combox)
        form.addRow(self.data_type, self.data_combox)
        form.addRow(self.new_file_path, self.new_file_path_btn)

        vbox = QVBoxLayout()
        vbox.addLayout(form)
        vbox.addWidget(self.start_btn)

        hbox = QHBoxLayout()
        hbox.addWidget(self.brower)
        hbox.addLayout(vbox)

        self.setLayout(hbox)

槽函數 update_log,將運行過程通過文本瀏覽器的方式實時展示,方便查看程序的運行。

  def update_log(self, text):
        cursor = self.brower.textCursor()
        cursor.movePosition(QTextCursor.End)
        self.brower.append(text)
        self.brower.setTextCursor(cursor)
        self.brower.ensureCursorVisible()

槽函數 excels_btn_click,綁定到文件加載按鈕,處理源文件的加載過程。

 def excels_btn_click(self):
        paths = QFileDialog.getOpenFileNames(self, '選擇文件', os.getcwd(), 'Excel File(*.xlsx)')
        files = paths[0]
        path_strs = ''
        for file in files:
            path_strs = path_strs + file + ';'
        self.excels.setText(path_strs)
        self.update_log('已經完成批文件路徑加載!')

槽函數 new_file_path_btn_click,選擇新文件要保存的路徑。

 def new_file_path_btn_click(self):
        directory = QFileDialog.getExistingDirectory(self, '選擇文件夾', os.getcwd())
        self.new_file_path.setText(directory)

槽函數 start_btn_click,綁定到開始按鈕上,使用開始按鈕啟動子線程工作。

    def start_btn_click(self):
        self.start_btn.setEnabled(False)
        self.thread_.start()

函數 finished,這個函數是用來接收子線程傳過來的運行完成的信號,通過判斷使子線程執行完成時讓開始按鈕處於可以點擊的狀態。

 def finished(self, finished):
        if finished is True:
            self.start_btn.setEnabled(True)

下面是最重要的邏輯處理部分,將所有的邏輯處理相關的部分全部放到子線程中去執行。

class DataThread(QThread):
    trigger = pyqtSignal(str)
    finished = pyqtSignal(bool)

    def __init__(self, parent=None):
        super(DataThread, self).__init__(parent)
        self.parent = parent
        self.working = True

    def __del__(self):
        self.working = False
        self.wait()

    def run(self):
        self.trigger.emit('啟動批量處理子線程...')
        oprate_type = self.parent.oprate_combox.currentText().strip()
        data_type = self.parent.data_combox.currentText().strip()
        files = self.parent.excels.text().strip()
        new_file_path = self.parent.new_file_path.text()
        if data_type == '按照Sheet拆分' and oprate_type == '數據合並':
            self.merge_data(files=files, new_file_path=new_file_path)
        elif data_type == '按照Sheet拆分' and oprate_type == '數據拆分':
            self.split_data(files=files, new_file_path=new_file_path)
        else:
            pass
        self.trigger.emit('數據處理完成...')
        self.finished.emit(True)

    def merge_data(self, files, new_file_path):
        num = 1
        new_file = new_file_path + '/數據匯總.xlsx'
        writer = pd.ExcelWriter(new_file)
        for file in files.split(';'):
            if file.strip() != '':
                web_sheet = pxl.load_workbook(file)
                sheets = web_sheet.sheetnames
                for sheet in sheets:
                    sheet_name = sheet.title()
                    self.trigger.emit('准備處理工作表名稱:' + str(sheet.title()))
                    data_frame = pd.read_excel(file, sheet_name=sheet_name)
                    sheet_name = sheet_name + 'TO數據合並' + str(num)
                    data_frame.to_excel(writer, sheet_name, index=False)
                    num = num + 1
            else:
                self.trigger.emit('當前路徑為空,繼續...')
        writer.save()
        writer.close()

    def split_data(self, files, new_file_path):
        num = 1
        for file in files.split(';'):
            if file.strip() != '':
                web_sheet = pxl.load_workbook(file)
                sheets = web_sheet.sheetnames
                for sheet in sheets:
                    sheet_name = sheet.title()
                    self.trigger.emit('准備處理工作表名稱:' + str(sheet.title()))
                    data_frame = pd.read_excel(file, sheet_name=sheet_name)
                    writer = pd.ExcelWriter(new_file_path + '/數據拆分' + str(num) + '.xlsx')
                    data_frame.to_excel(writer, '數據拆分', index=False)
                    writer.save()
                    writer.close()
                    num = num + 1
            else:
                self.trigger.emit('當前路徑為空,繼續...')

上面就是主要的代碼塊實現過程,有需要的可以參考一下。歡迎大佬在評論區進行留言。

搞了一個程序運行效果圖,看一下執行效果。

file

公眾號內回復 "Excel批量數據文件拆分與合並",獲取完整源代碼,直接運行即可。

file

【往期精選】

辦公自動化:PDF文件合並器,將多個PDF文件進行合並...

GUI猜數字游戲,直接開玩...

手把手教你做一個數據圖表生成器(附源碼)...

動態指針時鍾:利用pyqt5制作指針鍾表顯示實時時間

python 日志中最亮的仔,是喜歡的花里胡哨吖...


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM