python讀取docx內容

本文轉載自查看原文 2019-03-21 10:58 3106

環境：PyCharm python3.7

需要下載python-docx、docx（打開Settings->Project Interpreter->+搜索docx、python-docx install即可）

來源：https://blog.csdn.net/xtfge0915/article/details/83479922

#獲取文章全部內容

doc=docx.Document('D:\\Users\\Administrator\\PycharmProjects\\BigData\\Detail\\a.docx')

一級標題

for p in doc.paragraphs:

if p.style.name=='Heading 1':

print(p.text)

#二級標題

for p in doc.paragraphs:

if p.style.name=='Heading 2':

print(p.text)

#所有標題

import re

for p in doc.paragraphs:

if re.match("^Heading \d+$",p.style.name):

print(p.text)

#所有內容

for p in doc.paragraphs:

if p.style.name=='Normal':

print(p.text)

#從前面可以看出，如果知道不同內容的style.name，那么要讀這些內容是極其方便的，這些style.name可以通過：

#print(p.style.name)得到

for p in doc.paragraphs:

if p.style.name=='級別3：黑體 13磅 20行距段落前后20 左對齊':

print(p.text)

#輸出對應內容

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python-docx 讀取word.docx內容 python 讀取word表格內容並寫入到excel中去 .docx and .xlsx Python讀取docx文件 python-docx讀取doc,docx文檔 python-docx讀取doc文件 Python2　獲取docx/doc文件內容 PHP讀取word docx文檔內容及處理圖片 Java實現上傳txt,doc,docx文件並且讀取內容 JAVA讀取word（doc）（docx）標題和內容----POI Python讀取word文檔（python-docx包）