PDF文本內容批量提取到Excel


機器學習,統計項目合作QQ:231469242,版權所有

 https://study.163.com/provider/400000000398149/index.htm?share=2&shareId=400000000398149( 歡迎關注博主主頁,學習python視頻資源,還有大量免費python經典文章)


作用:pdf內容批量提取到excel

各位親朋好友,我才上班時候有個鼓噪乏味工作,就是把一個個PDF內容復制粘貼到Excel表格里面,方便以后數據庫全文搜索。

 

舉個例子,此Excel有兩個字段

A列是pdf文件名

B列用於存放pdf提取的內容

當所有PDF內容復制到Excel后,數據庫就可以實現全文搜索功能。

 

幾十上百個PDF復制粘貼工作也許一天就搞定了,但成千上萬個PDF,你是不是要抓狂?為此,我專門用Python開發了PDF批量提取機器人,名字叫pdf_data_extract3

程序放入文件夾,雙擊就完成自動提取

 

 

檢查錯誤數據

提取失敗的excel文件名保持在extract_failed_File.txt文檔中

 

如果任務百分之百成功,會顯示:恭喜主人,干的漂亮

 

給大家展示最后提取的結果,B列就是自動提取的內容。

 

有了PDF自動提取機器人,大家工作就沒這么辛苦了。只需要雙擊一下鼠標,然后泡杯咖啡,坐等機器人完成任務。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM