pdfplumber模块初始用

本文转载自查看原文 2019-08-01 15:41 1416

import pdfplumber 
import re
def pdf_read():
    pdf=pdfplumber.open('文件路径'")#文件路径,读取文件
    page0=pdf.pages[11] #指定页数
    tables=page0.extract_tables()#获得该页的表格
    texts=page0.extract_text()#获得text文本值

pdfplumber 缺省通过表格线来区分行和列，所以下列情况是无法提取出表格的：
* 你的表格是图片，通过选择可以确定是否图片
* 你的表格不是用线来分隔，或者分隔不全，例如列用线，行没线
这种情况下，你就需要尝试：
page0.extract_tables(table_settings={})

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 pdfplumber库解析pdf格式 Python 模块初始化的时候，发生了什么？ nginx源码分析之模块初始化 ABP中模块初始化过程(二) Python库PyPDF2和pdfplumber操作PDF UE4 游戏模块初始化顺序【转】python之pdfplumber读取拆分pdf内容和表格 STM32F10xx(高容量)WiFi模块的初始化和使用初始化mysql数据库提示缺少Data:dumper模块解决方法光模块