五種壓縮文件對比
python壓縮包操作依賴於本地的解壓縮軟件,所以不要指望rar工具會解壓zip文件,反之亦然。
以下列出五種壓縮文件
類型 | 模塊 | 說明 |
---|---|---|
gz | gizp | 通常僅僅能壓縮一個文件。與tar結合起來就能夠實現先打包,再壓縮。 |
tar | tarfile | linux系統下的打包工具。僅僅打包。不壓縮 |
tgz | gizp、tarfile | 即tar.gz。先用tar打包,然后再用gz壓縮得到的文件 |
zip | zipfile | 不同於gzip。盡管使用相似的算法,能夠打包壓縮多個文件。只是分別壓縮文件。壓縮率低於tar。 |
rar | rarfile | 打包壓縮文件。最初用於DOS,基於window操作系統。 |
需要解壓哪種就import哪個模塊,本節主要介紹一下zip和rar。
ZIPfile
help(zipfile)zipfile是內置模塊,文檔和官方的使用說明都很齊全。
常用方法
import zipfile
class MZipFile(object):
'''
python zipfile 模塊處理壓縮文件並讀取包里面的每個文件內容(行)
'''
def __init__(self, zip_path):
'''
:param zip_path: zip文件路徑
'''
self.zip = zipfile.ZipFile(zip_path, 'r') # 創建一個zipfile
def get_filecount(self):
'''
:return: 返回壓縮包里面的文件個數
'''
return len(self.zip.namelist())
def get_one_file(self):
'''
:return: 創建一個generator ,每次返回一個文件的內容
'''
for name in self.zip.namelist():
yield self.read_lines(name) # 生成器
def read_lines(self, name):
'''
:param name: 文件名
:return: 整個文件所有行(列表:每一行作為一個元素)
'''
return [line.decode() for line in self.zip.open(name).readlines()]
def get_filenames(self):
'''
:return: 返回自拍zip文件里面的所有文件名(列表:每個文件名作為一個元素)
'''
return self.zip.namelist()
def extract_to(self, path):
'''
解壓zip 文件
:param path: 解壓路徑
'''
self.zip.extractall(path)
return path
'''
Examples
'''
if __name__ == "__main__":
zip = MZipFile(zip_path="123.zip")
print("文件個數:", zip.get_filecount())
print("文件名列表:", zip.zip.namelist())
print("各個文件內容:", str(list(zip.get_one_file())))
print("解壓的路徑:", zip.extract_to("./test"))
rarfile
剛才說到zipfile是內置模塊,相比之下rarfile的文檔相當少,而且會有跨平台的問題。好在他是仿照zipfile寫的,所以接口和zipfile一致。
也就說zipfile的所有接口,到rarfile里也可以用。
查看壓縮包文件個數
import rarfile
rarfile_ = rarfile.RarFile(r'C:\Users\zhaobw\Desktop\測試.zip')
mylist = rarfile_.namelist()
for i in mylist:
print(i)