「Python實用秘技01」復雜zip文件的解壓

本文轉載自查看原文 2021-12-09 18:06 344 Python實用秘技

本文完整示例代碼及文件已上傳至我的Github倉庫https://github.com/CNFeffery/PythonPracticalSkills

　　這是我的新系列文章「Python實用秘技」的第1期，本系列立足於筆者日常工作中使用Python輔助辦公的心得體會，每一期為大家帶來一個3分鍾即可學會的簡單小技巧。

　　作為系列第1期，我們即將學習的是：復雜zip文件的解壓。

　　廢話不多說，直接看問題，使用過Python中的標准庫zipfile解壓過zip格式壓縮包的朋友們，可能遇到過，當壓縮文件中的目錄或文件名中包含中文等常見unicode字符時，典型如下面的例子：

　　使用zipfile的extract()或extractall()方法直接解壓時，產生的解壓結果名充斥着亂碼，這一點我們通過調用namelist()方法就可以看出來：

from zipfile import ZipFile

# 讀入壓縮包文件
file = ZipFile('示例壓縮包.zip')

# 查看壓縮包內目錄、文件名稱
file.namelist()

　　這是因為zipfile中針對壓縮包內容的編碼兼容性差，但我們可以通過下面的函數自行矯正：

def recode(raw: str) -> str:
    '''
    編碼修正
    '''
    
    try:
        return raw.encode('cp437').decode('gbk')
    
    except:
        return raw.encode('utf-8').decode('utf-8')
    
for file_or_path in file.namelist():
    
    print(file_or_path, ' -------> ' , recode(file_or_path))

　　解決了文件名亂碼的問題后，接下來我們就可以配合shutil與os標准庫中的相關功能，實現將指定任意zip壓縮包，完好地解壓到指定的目錄中，代碼如下：

def zip_extract_all(src_zip_file: ZipFile, target_path: str) -> None:
    
    # 遍歷壓縮包內所有內容
    for file_or_path in file.namelist():
        
        # 若當前節點是文件夾
        if file_or_path.endswith('/'):
            try:
                # 基於當前文件夾節點創建多層文件夾
                os.makedirs(os.path.join(target_path, recode(file_or_path)))
            except FileExistsError:
                # 若已存在則跳過創建過程
                pass
        
        # 否則視作文件進行寫出
        else:
            # 利用shutil.copyfileobj，從壓縮包io流中提取目標文件內容寫出到目標路徑
            with open(os.path.join(target_path, recode(file_or_path)), 'wb') as z:
                # 這里基於Zipfile.open()提取文件內容時需要使用原始的亂碼文件名
                shutil.copyfileobj(src_zip_file.open(file_or_path), z)
            
# 向已存在的指定文件夾完整解壓當前讀入的zip文件
zip_extract_all(file, '解壓測試')

　　可以看到，效果完美🥳：

　　本期分享結束，咱們下回見~👋

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python 解壓 zip 文件 Python解壓.zip文件「Python實用秘技04」為pdf文件批量添加文字水印 Python壓縮解壓zip文件利用python解壓zip文件「Python實用秘技02」給Python函數定“鬧鍾” python-批量解壓zip、rar文件 python將zip文件解壓到指定目錄 Python批量解壓.zip,7z文件使用Python解壓zip、rar文件