簡介:
.docx 文件結構在 python-docx 中的三種類型:
Document 對象表示整個文檔;Paragrapha 對象標識段落(在輸入文檔,每一次回車產生新段落);Run 對象標識相同樣式的文本延續。
Document 對象包含一個 Paragrapha 對象的列表,Paragraph 對象包含一個 Run 對象的列表。
文檔內容:
0、准備工作
0.1 安裝包
pip install python-docx
0.2 導入相關包
import os import re import docx
0.3 工作路徑設置
work_path = 'E:\\pyspace\\wdocuments' os.chdir(work_path)
1、讀取 word 文檔
doc = docx.Document('python 演示文檔.docx') # Document 對象
len(doc.paragraphs) # Paragraph 對象列表的長度
2、 paragraph 對象
for i, para in enumerate(doc.paragraphs): print(f'No.{i+1}\n', para.text, sep='')
3、run 對象
for i, para in enumerate(doc.paragraphs): for j, run in enumerate(para.runs): print(f'Para.{i+1} Run{j+i}: ', run.text, sep='')