原文鏈接:https://blog.csdn.net/jylonger/article/details/81109629
目前只針對純PDF圖片壓縮
實現原理: 主要通過PYMUPDF進行圖片提取,圖片壓縮,再合並生成一個新的PDF。
最后用Pyqt封裝成EXE
1. 提取原PDF關鍵代碼
pdffile = "t2.pdf" doc = fitz.open(pdffile) width, height = fitz.PaperSize("a4") totaling = doc.pageCount for pg in range(totaling): page = doc[pg] zoom = int(100) rotate = int(0) print(page) trans = fitz.Matrix(zoom / 100.0, zoom / 100.0).preRotate(rotate) pm = page.getPixmap(matrix=trans, alpha=False) lurl='pdf/%s.jpg' % str(pg+1) pm.writePNG(lurl) doc.close()
2.合並圖片生成PDF
#coding:utf-8 import glob import fitz import os def pictopdf(): doc = fitz.open() for img in sorted(glob.glob("pdf/*")): # 讀取圖片,確保按文件名排序 print(img) imgdoc = fitz.open(img) # 打開圖片 pdfbytes = imgdoc.convertToPDF() # 使用圖片創建單頁的 PDF imgpdf = fitz.open("pdf", pdfbytes) doc.insertPDF(imgpdf) # 將當前頁插入文檔 if os.path.exists("newpdf.pdf"): # 若文件存在先刪除 os.remove("newpdf.pdf") doc.save("newpdf.pdf") # 保存pdf文件 doc.close()
3、效果圖如下:
原PDF大小:44.2M,壓縮后:7.2M
4,pyqt實現的PDF壓縮工具下載: