在wps或者office里面可以將pdf轉word,不過只能免費轉前面5頁,超過5頁就需要會員。今天教大家一個Python辦公小技巧:批量Pdf轉Word ,這樣可以自由想轉多少頁都可以。
思路:這里主要是利用了Python的pdfmine3k庫去提取pdf文本內容,通過python-docx庫去將內容保存到word中。
下面先看一下效果:

01 環境准備
在開始編寫代碼之前,咱們先安裝一些用到的Python庫,安裝目錄如下:
pip install pdfminer
注意:
使用 pip install docx 安裝模塊 docx 后,發現不能正常使用,
並報錯 moduleNotFoundError:No module named 'exceptions'
正解:
pip install python-docx
02 提取PDF內容
1.導入相應的庫
from pdfminer.pdfparser import PDFParser, PDFDocument
解釋:

2.讀取pdf內容
在開始讀取之前,先看一下pdf的內容:

辰哥這里以自己的原創文章按模塊分類后,新建了一個兩頁的pdf文件。

上面代碼是讀取pdf文件,並把每一頁內容放到doc.get_pages里面。

通過循環可以把每一頁的內容提取出來,並把每一頁內容打印輸出

03 保存到word
上面我們已經成功將pdf的內容提取出來,接着我們將內容保存到word里面

在遍歷pdf內容里面將內容逐步寫入保存。最后保存命名為:Python研究者-辰哥.docx

04 小結
為了大家方便學習,辰哥已經把本文的完整源碼上傳,需要的在公眾后台回復:pdf轉換
辰哥在本文中主要講解了利用Python對批量Pdf轉換為Word,不明白的地方可以在下方留言,一起交流。
