【轉】PDF 用python 壓縮


原文鏈接:https://blog.csdn.net/jylonger/article/details/81109629

 

目前只針對純PDF圖片壓縮

實現原理: 主要通過PYMUPDF進行圖片提取,圖片壓縮,再合並生成一個新的PDF。

最后用Pyqt封裝成EXE

1. 提取原PDF關鍵代碼

pdffile = "t2.pdf"
doc = fitz.open(pdffile)
width, height = fitz.PaperSize("a4")
 
totaling = doc.pageCount
 
for pg in range(totaling):
    page = doc[pg]
    zoom = int(100)
    rotate = int(0)
    print(page)
    trans = fitz.Matrix(zoom / 100.0, zoom / 100.0).preRotate(rotate)
    pm = page.getPixmap(matrix=trans, alpha=False)
 
    lurl='pdf/%s.jpg' % str(pg+1)
    pm.writePNG(lurl)
doc.close()

  

 

2.合並圖片生成PDF

#coding:utf-8
import glob
import fitz
import os
 
def pictopdf():
    doc = fitz.open()
    for img in sorted(glob.glob("pdf/*")):  # 讀取圖片,確保按文件名排序
        print(img)
        imgdoc = fitz.open(img)                 # 打開圖片
        pdfbytes = imgdoc.convertToPDF()        # 使用圖片創建單頁的 PDF
        imgpdf = fitz.open("pdf", pdfbytes)
        doc.insertPDF(imgpdf)                   # 將當前頁插入文檔
    if os.path.exists("newpdf.pdf"):        # 若文件存在先刪除
        os.remove("newpdf.pdf")
    doc.save("newpdf.pdf")                   # 保存pdf文件
    doc.close()

  

3、效果圖如下:

原PDF大小:44.2M,壓縮后:7.2M

4,pyqt實現的PDF壓縮工具下載:

https://download.csdn.net/download/jylonger/10553922

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM