python tar.gz格式壓縮、解壓


一、壓縮

需求描述

現在有一個目錄,需要將此目錄打包成tar.gz文件。因為有一個Django項目,需要用到此功能!

tar.gz

目錄結構如下:

./
├── folder
│   ├── 1.doc
│   └── 2.txt
└── packing.py

 

packing.py 是python程序,需要將folder目錄打包成tar.gz文件

 

packing.py 內容如下:

#!/usr/bin/env python3
# coding: utf-8
import os, tarfile

def make_targz(output_filename, source_dir):
    """
    一次性打包目錄為tar.gz
    :param output_filename: 壓縮文件名
    :param source_dir: 需要打包的目錄
    :return: bool
    """
    try:
        with tarfile.open(output_filename, "w:gz") as tar:
            tar.add(source_dir, arcname=os.path.basename(source_dir))

        return True
    except Exception as e:
        print(e)
        return False

make_targz('aa.tar.gz','folder')

 

注意:

空子目錄會被打包,如果只打包不壓縮,將"w:gz"參數改為"w:"或"w"即可。

 

執行程序,會在當前目錄下生成aa.tar.gz文件 

 

二、解壓

def untar(fname, dirs):
    """
    解壓tar.gz文件
    :param fname: 壓縮文件名
    :param dirs: 解壓后的存放路徑
    :return: bool
    """
    try:
        t = tarfile.open(fname)
        t.extractall(path = dirs)
        return True
    except Exception as e:
        print(e)
        return False

untar('aa.tar.gz','./')

 

完整代碼如下:

#!/usr/bin/env python3
# coding: utf-8
import os, tarfile

def make_targz(output_filename, source_dir):
    """
    一次性打包目錄為tar.gz
    :param output_filename: 壓縮文件名
    :param source_dir: 需要打包的目錄
    :return: bool
    """
    try:
        with tarfile.open(output_filename, "w:gz") as tar:
            tar.add(source_dir, arcname=os.path.basename(source_dir))

        return True
    except Exception as e:
        print(e)
        return False


def untar(fname, dirs):
    """
    解壓tar.gz文件
    :param fname: 壓縮文件名
    :param dirs: 解壓后的存放路徑
    :return: bool
    """
    try:
        t = tarfile.open(fname)
        t.extractall(path = dirs)
        return True
    except Exception as e:
        print(e)
        return False

# make_targz('aa.tar.gz','folder')
untar('aa.tar.gz','./')
View Code

 

執行程序,就會將aa.tar.gz解壓到當前文件夾下

 

三、壓縮原理

把文件的二進制代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0 的寫法60,來減少該文件的空間。

由於計算機處理的信息是以二進制數的形式表示的,因此壓縮軟件就是把 二進制信息中相同的字符串以特殊字符標記來達到壓縮的目的。為了有助於理解文件壓縮,請在腦海里想象一幅藍天白雲的圖片。對於成千上萬單調重復的藍色像點而言,與其一個一個定義“藍、藍、藍……”長長的一串顏色,還不如告訴電腦:“從這個位置開始存儲1117個藍色像點”來得簡潔,而且還能大大節約存儲空間。這是一個非常簡單的圖像壓縮的例子。其實,所有的計算機文件歸根結底都是以“1”和“0”的形式存儲的,和藍色像點一樣,只要通過合理的數學計算公式,文件的體積都能夠被大大壓縮以達到“數據無損稠密”的效果。總的來說,壓縮可以分為有損和無損壓縮兩種。如果丟失個別的數據不會造成太大的影響,這時忽略它們是個好主意,這就是有損壓縮。有損壓縮廣泛應用於動畫、聲音和圖像文件中,典型的代表就是影碟文件格式mpeg、音樂文件格式mp3和圖像文件格式jpg。但是更多情況下壓縮數據必須准確無誤,人們便設計出了無損壓縮格式,比如常見的zip、rar等。壓縮軟件(compression software)自然就是利用壓縮原理壓縮數據的工具,壓縮后所生成的文件稱為壓縮包(archive),體積只有原來的幾分之一甚至更小。當然,壓縮包已經是另一種文件格式了,如果想使用其中的數據,首先得用壓縮軟件把數據還原,這個過程稱作解壓縮。常見的壓縮軟件有winzip、winrar等。

 

本文參考鏈接:

https://www.cnblogs.com/liangqihui/p/9219333.html

https://www.cnblogs.com/kaituorensheng/p/4493145.html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM