寫在前面

一個pdf文件中有很多頁，每頁有若干張圖片，如何將pdf文件中的所有圖片提取出來？

安裝模塊

pip install pymupdf

示例代碼

import fitz


def func(doc):
    for i in range(len(doc)):
        imglist = doc.getPageImageList(i)
        for j, img in enumerate(imglist):
            xref = img[0]
            pix = fitz.Pixmap(doc, xref)   # make pixmap from image
            if pix.n - pix.alpha < 4:      # can be saved as PNG
                pix.writePNG("p%s-%s.png" % (i+1, j+1))
            else:                          # CMYK: must convert first
                pix0 = fitz.Pixmap(fitz.csRGB, pix)
                pix0.writePNG("p%s-%s.png" % (i+1, j+1))
                pix0 = None                # free Pixmap resources
            pix = None                     # free Pixmap resources


if __name__ == "__main__":
    func(doc=fitz.open('xxx.pdf'))         # input the path of pdf file

參數說明

func(doc=fitz.open('xxx.pdf'))中xxx.pdf更改為你的pdf文件所在的路徑即可。

pix.writePNG()中設置提取的圖片的保存路徑。

業務邏輯

代碼邏輯很簡單：對pdf文件進行for循環，遍歷每一頁；然后對每一頁進行for循環，遍歷每一頁中的圖片。

引用參考

https://pymupdf.readthedocs.io/en/latest/document.html#other-examples

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python如何提取pdf文件圖片中的文字？ Java 使用PDFBox提取PDF文件中的圖片第一節：python提取PDF文檔中的圖片 python實現對文件夾內所有jpg圖片的提取 Office系列(2)---提取Office文件(Word、PPT)中的所有圖片 python提取bag文件中的圖片數據 Java 添加、提取PDF中的圖片 python——提取pdf中的指定頁 python提取視頻中的圖片 pdf轉圖片、提取pdf文本、提取pdf圖片