前面寫了很多利用python-docx批量處理word文件的教程,但是python-docx不支持doc格式,因此如何將doc文件轉為docx文件就是一個需要解決的問題,如果文件少可以另存為,如何文件多呢,因此需要一個doc批量轉docx的方法。
該方法需要用到另外一個python庫win32com,安裝方法:
安裝win32com
轉換方法如下 :
from win32com import client as wc
w = wc.Dispatch('Word.Application')
# 或者使用下面的方法,使用啟動獨立的進程:
# w = wc.DispatchEx('Word.Application')
doc=w.Documents.Open("E:\\Jupyter\\s.doc")
doc.SaveAs("E:\\Jupyter\\sa.docx",16)#必須有參數16,否則會出錯.
此外,如果利用python-docx將.docx文件存儲為.doc,這個 doc文件是可以利用python-docx打開的,如何是用office創建的則不行。
