python-批量解壓zip、rar文件


有bug,因為測試用的小文件--沒啥問題,但實際是要解壓一些學習資料(比較大,出錯可能也看不出來),后來就發現可能有問題了。

自己平時又不用--不改了,所以代碼僅供參考

這是一個用python寫解壓大量zip腳本的說明,本人新手一個,希望能對各位有所啟發。

GitHub:https://github.com/lgf133214/Windows-python3-

首先要注意的,在運行自己的腳本之前一定先備份或者復制出一些樣本進行測試,不然出錯會很麻煩;

之后我用到的是解壓zip文件的擴展包zipfile,可以直接pip安裝或者在IDE里安裝,需要特別注意的是這個包的文件名解碼方式需要我們去修改,先去查看源文件,直接搜索“cp437”(一個編碼方式),找到后全部替換為“gbk”,即可解決中文顯示問題。

代碼:

import os
import shutil
import zipfile
import rarfile

# 首先引入需要的工具包
# shutil為后期移動文件所需


# 路徑改這里!
parent_path = input('請輸入要解壓的文件路徑:')

# 文件類型選擇
file_flag = '.' + input('請輸入一種需要的壓縮類型(例:zip):')


# 刪除已解壓過的文件
# 一定要先測試,不然很麻煩
def del_old_zip(file_path):
    os.remove(file_path)


# 解壓
def zip_decompress(file_path, root):
    # 開始
    # zipfile打開zip文件
    z = zipfile.ZipFile(f'{file_path}', 'r')

    # 解壓
    z.extractall(path=f"{root}")  # path為解壓路徑,解包后位於該路徑下

    # 判斷是否需要重復解包
    for names in z.namelist():
        if names.endswith(file_flag):
            z.close()
            return 1

    # 結束
    z.close()

    return 0


def rar_decompress(file_path, root):
    # 開始
    # rarfile打開rar文件
    z = rarfile.RarFile(f'{file_path}', 'r')

    # 解壓
    z.extractall(path=f"{root}")  # path為解壓路徑,解包后位於該路徑下

    # 判斷是否需要重復解包
    for names in z.namelist():
        if names.endswith(file_flag):
            z.close()
            return 1

    # 結束
    z.close()

    return 0


decompress = None
if file_flag == '.zip':
    decompress = zip_decompress
elif file_flag == '.rar':
    decompress = rar_decompress
else:
    print('格式輸入錯誤或不支持當前格式')
    os.system('pause')
    exit(0)


# 因為我在使用過程中發現有些文件解包后會混在一起
# 在平時大家手動解壓時可能也會遇到提示是否覆蓋的問題
# 下面的兩個函數解決這一問題

# 開始要先創建一個大文件夾  與壓縮包名字相同
# 避免后期混亂和麻煩
def start_dir_make(root, dirname):
    os.chdir(root)
    os.mkdir(dirname)
    return os.path.join(root, dirname)


# 去除多余文件夾
def rem_dir_extra(root, father_dir_name):
    # 遞歸要注意信息的正常處理  搞不好上一個調用已經改變了東西  而下面的調用還是使用之前的數據

    try:

        # 判斷文件夾重名  開始
        for item in os.listdir(os.path.join(root, father_dir_name)):

            # 第一步判斷是不是一個文件夾,如果不是則跳過本次循環
            if not os.path.isdir(os.path.join(root, father_dir_name, item)):
                continue

            # 判斷是否要脫掉一層目錄結構
            # 文件夾名字要相同,且子目錄中只有單獨的一個文件夾
            if item == father_dir_name and len(
                    os.listdir(os.path.join(root, father_dir_name))) == 1:

                # 改變工作目錄
                os.chdir(root)

                # 將無用文件夾重命名,因為直接移動會有重名錯誤
                os.rename(father_dir_name, father_dir_name + '-old')

                # 移動文件后刪除空文件夾
                shutil.move(os.path.join(root, father_dir_name + '-old', item), os.path.join(root))
                os.rmdir(os.path.join(root, father_dir_name + '-old'))

                # 將去掉一層目錄結構后的文件夾繼續作為父本遞歸處理下去
                # 這里要注意,上面已經發生過數據的改動,所以下面遞歸傳參一定要正確!
                rem_dir_extra(root, item)

            else:

                # 處理那些不滿足上面條件的文件夾
                rem_dir_extra(os.path.join(root, father_dir_name), item)

    except Exception as e:

        # 打印錯誤信息
        print("清除文件夾出錯" + str(e))


# 入口
if __name__ == '__main__':

    flag = 1

    while flag:

        #  循環遍歷文件夾
        for root, dirs, files in os.walk(parent_path):

            # 讀取文件名
            for name in files:

                if name.endswith(file_flag):
                    # 創建文件夾
                    new_ws = start_dir_make(root, name.replace(file_flag, ''))

                    # zip文件地址
                    zip_path = os.path.join(root, name)

                    # 解壓
                    flag = decompress(zip_path, new_ws)


                    # 一定要備份或先測試,不然可能會涼,自己選擇修改
                    del_old_zip(zip_path)

                    # 去掉多余的文件結構
                    rem_dir_extra(root, name.replace(file_flag, ''))

                    print(f'{root}\\{name}'.join(['文件:', '\n解壓完成\n']))

    # 由於解壓可能解了好幾次 所以可能會有已經解壓好的父級目錄重名無法處理 這里要再處理一次
    rem_dir_extra(os.path.split(parent_path)[0], os.path.split(parent_path)[1])

    print("解壓完成啦,記得檢查有沒有{}格式之外的呀!\n\n其他格式需要自己改一下了".format(file_flag))

    os.system('pause')

 

  

 

  

好了,以上僅是個人所遇到的問題的解決方案,希望能對各位有所幫助,如果解決不了問題還請耐心查閱其他資料,將過程理順之后再去實踐,一定程度可以讓自己保持清醒,提高效率。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM