2017-10-17 112 views
-1

我正在做一個與分析相關的項目。爲此,我需要從MS WORD中統計一些行的值。如果它是.docx擴展名,那麼對我來說沒有問題,但是當它是一個.doc擴展名時,我不能假設讀取這些文件。我能爲此做些什麼?我使用python 3.6並安裝了.docx模塊。期待一個好的答案。提前致謝!如何在Python中檢索MS WORD(2003)doc文件

回答

1

你可以做到這一點使用win32com:

import win32com 

from win32com.client import gencache, constants, Dispatch 
# that's the magic part 
gencache.EnsureModule('{00020905-0000-0000-C000-000000000046}', 0, 8, 3) 

app = Dispatch("Word.Application.8") 
# open a document 
app.Documents.Open("MyDocument.doc") 

現在你可以做任何你想要的這個文件。 如果與gencache行給你一個錯誤,那麼你就需要通過執行先創建COM模塊:

lib\site-packages\win32com\client\makepy.py 

這會彈出,你需要選擇「Microsoft Word對象庫」的窗口。