花费 35 ms
利用python第三方库提取PDF文件的表格内容

小爬最近接到一个棘手任务:需要提取手机话费电子发票PDF文件中的数据。接到这个任务的第一时间,小爬决定搜集各个地区各个时间段的电子发票文件,看看其中的差异点。粗略统计下来,PDF文件的表格框架是统一的 ...

Fri Dec 06 23:22:00 CST 2019 0 1516
python 给pdf 添加目录

可以使用 pymupdf对pdf操作 添加目录 import fitz doc = fitz.open('/Users/zhang_gy/Desktop/知识点集锦.pdf') # 获取目录 toc = doc.getToC() # 目录内容 tocs = [ # [目录 ...

Sat Apr 11 07:39:00 CST 2020 0 878

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM