一、壓縮
需求描述
現在有一個目錄,需要將此目錄打包成tar.gz文件。因為有一個Django項目,需要用到此功能!
tar.gz
目錄結構如下:
./ ├── folder │ ├── 1.doc │ └── 2.txt └── packing.py
packing.py 是python程序,需要將folder目錄打包成tar.gz文件
packing.py 內容如下:
#!/usr/bin/env python3 # coding: utf-8 import os, tarfile def make_targz(output_filename, source_dir): """ 一次性打包目錄為tar.gz :param output_filename: 壓縮文件名 :param source_dir: 需要打包的目錄 :return: bool """ try: with tarfile.open(output_filename, "w:gz") as tar: tar.add(source_dir, arcname=os.path.basename(source_dir)) return True except Exception as e: print(e) return False make_targz('aa.tar.gz','folder')
注意:
空子目錄會被打包,如果只打包不壓縮,將"w:gz"參數改為"w:"或"w"即可。
執行程序,會在當前目錄下生成aa.tar.gz文件
二、解壓
def untar(fname, dirs): """ 解壓tar.gz文件 :param fname: 壓縮文件名 :param dirs: 解壓后的存放路徑 :return: bool """ try: t = tarfile.open(fname) t.extractall(path = dirs) return True except Exception as e: print(e) return False untar('aa.tar.gz','./')
完整代碼如下:

#!/usr/bin/env python3 # coding: utf-8 import os, tarfile def make_targz(output_filename, source_dir): """ 一次性打包目錄為tar.gz :param output_filename: 壓縮文件名 :param source_dir: 需要打包的目錄 :return: bool """ try: with tarfile.open(output_filename, "w:gz") as tar: tar.add(source_dir, arcname=os.path.basename(source_dir)) return True except Exception as e: print(e) return False def untar(fname, dirs): """ 解壓tar.gz文件 :param fname: 壓縮文件名 :param dirs: 解壓后的存放路徑 :return: bool """ try: t = tarfile.open(fname) t.extractall(path = dirs) return True except Exception as e: print(e) return False # make_targz('aa.tar.gz','folder') untar('aa.tar.gz','./')
執行程序,就會將aa.tar.gz解壓到當前文件夾下
三、壓縮原理
把文件的二進制代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0 的寫法60,來減少該文件的空間。
由於計算機處理的信息是以二進制數的形式表示的,因此壓縮軟件就是把
二進制信息中相同的字符串以特殊字符標記來達到壓縮的目的。為了有助於理解文件壓縮,請在腦海里想象一幅藍天白雲的圖片。對於成千上萬單調重復的藍色像點而言,與其一個一個定義“藍、藍、藍……”長長的一串顏色,還不如告訴電腦:“從這個位置開始存儲1117個藍色像點”來得簡潔,而且還能大大節約存儲空間。這是一個非常簡單的圖像壓縮的例子。其實,所有的計算機文件歸根結底都是以“1”和“0”的形式存儲的,和藍色像點一樣,只要通過合理的數學計算公式,文件的體積都能夠被大大壓縮以達到“數據無損稠密”的效果。總的來說,壓縮可以分為有損和無損壓縮兩種。如果丟失個別的數據不會造成太大的影響,這時忽略它們是個好主意,這就是有損壓縮。有損壓縮廣泛應用於動畫、聲音和圖像文件中,典型的代表就是影碟文件格式mpeg、音樂文件格式mp3和圖像文件格式jpg。但是更多情況下壓縮數據必須准確無誤,人們便設計出了無損壓縮格式,比如常見的zip、rar等。壓縮軟件(compression software)自然就是利用壓縮原理壓縮數據的工具,壓縮后所生成的文件稱為壓縮包(archive),體積只有原來的幾分之一甚至更小。當然,壓縮包已經是另一種文件格式了,如果想使用其中的數據,首先得用壓縮軟件把數據還原,這個過程稱作解壓縮。常見的壓縮軟件有winzip、winrar等。
本文參考鏈接:
https://www.cnblogs.com/liangqihui/p/9219333.html
https://www.cnblogs.com/kaituorensheng/p/4493145.html