from http://www.iplaypython.com/module/gzip.html
一、使用gzip模塊壓縮文件
>>> import gzip #導入gzip模塊,玩蛇網提示:注意名字為全小寫
>>> g = gzip.GzipFile(filename="", mode="wb", compresslevel=9, fileobj=open('sitemap.log.gz', 'wb'))
>>> g.write(open('d:\\test\\sitemap.xml').read())
>>> g.close()
其中,filename參數是壓縮文件內,文件的名字,為空也可以,不修改。fileobj是生成的壓縮文件對象,它的路徑名稱等。最后是把文件寫入gzip文件中去,再關閉操作連接。
二、使用gzip模塊解壓縮文件
>>> g = gzip.GzipFile(mode="rb", fileobj=open('d:\\test\\sitemap.log.gz', 'rb'))
>>> open(r"d:\\haha.xml", "wb").write(g.read())
使用的時候注意,函數方法的大小寫一點要看仔細,如果gzip文件是這種形式的:*.tar.gz,證明先是由tar命令壓縮后,后再由 gzip壓縮的,需要先用解壓縮tar文件,再用gzip模塊解壓縮。其實,現在很多網頁為了提高瀏覽器端用戶的訪問速度,和搜索引擎爬蟲抓取的速度,都在使用gzip壓縮。