原文:使用PyPDF2结合pdfminer拆分PDF,并提取关键字重命名拆分出来的文件

需求:银行汇款回单PDF几十页,每一页包含两个回单。需把每一张回单拆分出来,并且以回单上交易附言处TPPXXXXXXXX格式的流水号重命名拆出来的文件。 思路: .使用PyPDF 把每一页一分为二,输出PDF到一个目录A。 .循环目录A,使用pdfminer提取TPPXXXXXXXX格式的流水号,重命名PDF文件。 .使用pyinstaller F 打包成一个exe文件。 注意:要在C盘打包 CM ...

2020-04-15 22:39 0 755 推荐指数:

查看详情

Python对pdf中的关键字过滤(pdfminer3k或pdfminer使用

最近在实习,老板一下子发给了我120份研报,然而很多都是没用的。聪明的大脑一定要想办法让电脑帮助自己完成简单的工作! 下面是Python筛选含有“”丙烯“”关键字的程序,由于文件的保密性只能贴出代码。 注意: pip install pdfminer3k而不是pdfminer导入的时候名字 ...

Thu Jun 13 01:08:00 CST 2019 0 1335
Python操作PDF-文本和图片提取使用PyPDF2和PyMuPDF)

PDF文件格式 如今,可移植文档格式(PDF)属于最常用的数据格式。在1990年,PDF文档的结构由Adobe定义。PDF格式的思想是,对于通信过程中涉及的双方(创建者,作者或发送者以及接收者)而言,传输的数据/文档看起来完全相同。 工具和库 适用于Python的PDF工具,模块和库的可用 ...

Fri Dec 25 19:58:00 CST 2020 1 1909
使用PyPDF2库对pdf文件进行指定页面删除操作

平台:win10家庭版,python 3.7,PyPDF2 思维过程: 方法一:将pdf文件通过拆分为单页,放入一个文件夹,再删除其中不要的文件,最后再把剩余的文件进行合并为一个pdf文件 第一步:使用文件路径创建新文件夹,用于存放拆分后的单页文件 ...

Thu Jun 13 05:58:00 CST 2019 0 481
【转】Python 深入浅出 - PyPDF2 处理 PDF 文件

实际应用中,可能会涉及处理 pdf 文件PyPDF2 就是这样一个库,使用它可以轻松的处理 pdf 文件,它提供了读,割,合并,文件转换等多种操作。 文档地址:http://pythonhosted.org/PyPDF2/ PyPDF2 安装PyCharm 安装:File -> ...

Sun Aug 11 19:03:00 CST 2019 0 1411
合并pdf文件带书签代码(利用python的PyPDF2,并解决PyPDF2 编码问题'latin-1'和PyPDF2报错:PdfReadError: EOF marker not found)

1.文件准备: 先将扫描的pdf文件,每一章放到一个文件夹中,文件夹名字用章节名命名。 这样最终程序就能将章节名作为书签了,而不是默认将每页都生成书签。 【最新代码,更新PyPDF2后可用】用的3.8的python 2023.1.25更新 2.程序代码 代码运行 ...

Wed Apr 20 05:41:00 CST 2022 0 668
Python应用【PDF处理-pypdf2

概述 Python处理PDF文件需要安装相应的库:【PyPDF2】库 使用场景 工作中可能会涉及处理pdf文件PyPDF2就是这样一个库, 使用它可以轻松的处理 pdf 文件,它提供了读、写、分割、合并、文件转换等多种操作。 安装库 网站 使用说明 PyPDF2 官方文档 ...

Sun Dec 02 08:14:00 CST 2018 0 2226
Python库PyPDF2和pdfplumber操作PDF

前言   Python 操作 PDF 会用到两个库,分别是:PyPDF2 和 pdfplumber   其中 PyPDF2 可以更好的读取、写入、分割、合并PDF文件,而 pdfplumber 可以更好的读取 PDF 文件中内容和提取 PDF 中的表格 对应的官网分别 ...

Mon Jan 24 23:14:00 CST 2022 0 963
Python之PyPDF2模块的使用

PyPDF2模块主要的功能是分割或合并PDF文件,裁剪或转换PDF文件中的页面。 0、安装PyPDF2的模块 1、常用的函数 2、读取PDF文件,取指定页数,写入到硬盘上的示例 3、读取PDF某一页,旋转180度后,写入到新的PDF文件 ...

Sat Jan 18 23:38:00 CST 2020 0 4304
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM