-1
我正在做一個與分析相關的項目。爲此,我需要從MS WORD中統計一些行的值。如果它是.docx擴展名,那麼對我來說沒有問題,但是當它是一個.doc擴展名時,我不能假設讀取這些文件。我能爲此做些什麼?我使用python 3.6並安裝了.docx模塊。期待一個好的答案。提前致謝!如何在Python中檢索MS WORD(2003)doc文件
我正在做一個與分析相關的項目。爲此,我需要從MS WORD中統計一些行的值。如果它是.docx擴展名,那麼對我來說沒有問題,但是當它是一個.doc擴展名時,我不能假設讀取這些文件。我能爲此做些什麼?我使用python 3.6並安裝了.docx模塊。期待一個好的答案。提前致謝!如何在Python中檢索MS WORD(2003)doc文件
你可以做到這一點使用win32com:
import win32com
from win32com.client import gencache, constants, Dispatch
# that's the magic part
gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 3)
app = Dispatch("Word.Application.8")
# open a document
app.Documents.Open("MyDocument.doc")
現在你可以做任何你想要的這個文件。 如果與gencache行給你一個錯誤,那麼你就需要通過執行先創建COM模塊:
lib\site-packages\win32com\client\makepy.py
這會彈出,你需要選擇「Microsoft Word對象庫」的窗口。