機器學習,統計項目合作QQ:231469242,版權所有
https://study.163.com/provider/400000000398149/index.htm?share=2&shareId=400000000398149( 歡迎關注博主主頁,學習python視頻資源,還有大量免費python經典文章)
作用:pdf內容批量提取到excel
各位親朋好友,我才上班時候有個鼓噪乏味工作,就是把一個個PDF內容復制粘貼到Excel表格里面,方便以后數據庫全文搜索。
舉個例子,此Excel有兩個字段
A列是pdf文件名
B列用於存放pdf提取的內容
當所有PDF內容復制到Excel后,數據庫就可以實現全文搜索功能。
幾十上百個PDF復制粘貼工作也許一天就搞定了,但成千上萬個PDF,你是不是要抓狂?為此,我專門用Python開發了PDF批量提取機器人,名字叫pdf_data_extract3
程序放入文件夾,雙擊就完成自動提取
檢查錯誤數據
提取失敗的excel文件名保持在extract_failed_File.txt文檔中
如果任務百分之百成功,會顯示:恭喜主人,干的漂亮
給大家展示最后提取的結果,B列就是自動提取的內容。
有了PDF自動提取機器人,大家工作就沒這么辛苦了。只需要雙擊一下鼠標,然后泡杯咖啡,坐等機器人完成任務。