python解壓zip包中文亂碼解決方式


 

亂碼得原因:

由於ZipFile模塊導出遇到中文解碼不對,windows上會出現,linux是否會出現不知道沒測試過。

 

解決方式:

1. 搞個文件名引射表(不太方便,少量文件夾套用時候還可以)

2. 修改源碼解碼格式(不太方便,自己搞了一下,之后報其他錯誤)

3. 自己寫入文件,自己創建文件夾(推薦)

 

自己創建的寫法:

        with zipfile.ZipFile(file=zip_save_path, mode='r') as zf:
            # 解壓到指定目錄,首先創建一個解壓目錄
            os.mkdir(unzip_dir_path)
            for old_name in zf.namelist():
                # 獲取文件大小,目的是區分文件夾還是文件,如果是空文件應該不好用。
                file_size = zf.getinfo(old_name).file_size
                # 由於源碼遇到中文是cp437方式,所以解碼成gbk,windows即可正常
                new_name = old_name.encode('cp437').decode('gbk')
                # 拼接文件的保存路徑
                new_path = os.path.join(unzip_dir_path, new_name)
                # 判斷文件是文件夾還是文件
                if file_size > 0:
                   # 是文件,通過open創建文件,寫入數據
                    with open(file=new_path, mode='wb') as f:
                        # zf.read 是讀取壓縮包里的文件內容
                        f.write(zf.read(old_name))
                else:
                    # 是文件夾,就創建
                    os.mkdir(new_path)

結果正常:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM