太方便了!利用Python對批量Pdf轉Word


在wps或者office里面可以將pdf轉word,不過只能免費轉前面5頁,超過5頁就需要會員。今天教大家一個Python辦公小技巧:批量Pdf轉Word ,這樣可以自由想轉多少頁都可以。

思路:這里主要是利用了Python的pdfmine3k庫去提取pdf文本內容,通過python-docx庫去將內容保存到word中。

下面先看一下效果:

01 環境准備

在開始編寫代碼之前,咱們先安裝一些用到的Python庫,安裝目錄如下:

pip install pdfminer

注意

使用 pip install docx 安裝模塊 docx 后,發現不能正常使用,

並報錯 moduleNotFoundError:No module named 'exceptions'

正解

pip install python-docx

02 提取PDF內容

1.導入相應的庫

from pdfminer.pdfparser import PDFParser, PDFDocument

解釋

2.讀取pdf內容

在開始讀取之前,先看一下pdf的內容:

辰哥這里以自己的原創文章按模塊分類后,新建了一個兩頁的pdf文件。

上面代碼是讀取pdf文件,並把每一頁內容放到doc.get_pages里面。

通過循環可以把每一頁的內容提取出來,並把每一頁內容打印輸出

03 保存到word

上面我們已經成功將pdf的內容提取出來,接着我們將內容保存到word里面

在遍歷pdf內容里面將內容逐步寫入保存。最后保存命名為:Python研究者-辰哥.docx

04 小結

為了大家方便學習,辰哥已經把本文的完整源碼上傳,需要的在公眾后台回復:pdf轉換

辰哥在本文中主要講解了利用Python對批量Pdf轉換為Word,不明白的地方可以在下方留言,一起交流。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM