2016-11-26 109 views
-1

我正嘗試將.doc文件格式轉換成.html文件格式。我已經在Python中使用docx2html將.docx文件轉換爲.html,但是我在轉換.doc格式文件時遇到了問題。我嘗試使用Python中的子進程將.doc轉換爲.docx,但我使用的是MAC OS X,而子進程在MAC上無法使用。我的問題是,我應該只在Python中這樣做。有沒有辦法做到這一點?謝謝使用Python將.doc轉換爲.html

P.S.我當我使用的子進程的文檔轉換爲DOCX此錯誤:

File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 522, in call 
return Popen(*popenargs, **kwargs).wait() 

File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 710, in __init__ 
    errread, errwrite) 

File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 1335, in _execute_child 
    raise child_exception 
OSError: [Errno 2] No such file or directory 
+1

爲什麼'subprocess'沒有工作?在我的MAC OS X上很好,會發生什麼?你可以使用舊的'os.system()',但'subprocess'是首選。 – cdarke

+0

Antiword似乎是讀取.doc文件的Python程序包。 – cco

+0

@cdarke我編輯我的問題,並添加我使用子進程時得到的錯誤 – Minerva

回答

0

只需將您的DOC文件轉換成docx.You可以使用這個HTML解析Python庫,美味的湯。

或使用this 它將格式化的文本/文件文件轉換爲簡單的HTML標記,保留粗體,斜體,鏈接和段落,但不爲字體大小和麪添加標籤。正是我需要節省一些時間。

+0

謝謝,但你沒完全讀完我的問題嗎?我可以將.docx轉換爲.html,但我無法將.doc轉換爲.docx。我嘗試了一切,但沒有成功! – Minerva

+0

哦,我明白了。你可以嘗試我給你的替代解決方案。美麗的湯也很方便。 – Inconnu

+0

它是否也適用於doc文件? – Minerva