Python 處理 word 文檔(一):Document 、Paragraph 和 Run 對象的


簡介:

.docx 文件結構在 python-docx 中的三種類型:

Document 對象表示整個文檔;Paragrapha 對象標識段落(在輸入文檔,每一次回車產生新段落);Run 對象標識相同樣式的文本延續。

Document 對象包含一個 Paragrapha 對象的列表,Paragraph 對象包含一個 Run 對象的列表。

 

文檔內容:

 

 

 

 

0、准備工作

   0.1 安裝包

pip  install  python-docx

  0.2 導入相關包

import os import re import docx  

  0.3 工作路徑設置

work_path = 'E:\\pyspace\\wdocuments' os.chdir(work_path)

 

1、讀取 word 文檔

doc = docx.Document('python 演示文檔.docx')  # Document 對象
len(doc.paragraphs)  # Paragraph 對象列表的長度

 

 2、 paragraph 對象

for i, para in enumerate(doc.paragraphs): print(f'No.{i+1}\n', para.text, sep='')

 

 3、run 對象

for i, para in enumerate(doc.paragraphs): for j, run in enumerate(para.runs): print(f'Para.{i+1} Run{j+i}: ', run.text, sep='')

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM