2016-11-29 108 views
2

嘗試使用AWS Lambda上的Python將MS Word文件轉換爲HTML。對於.docx,我知道有一個名爲python-docx的庫。但是說到.doc,我仍然無法找到一個優雅而簡單的解決方案,因爲大多數可能的解決方案都使用LibreOffice或OpenOffice。使用AWS上的Python將MS Word(.doc和.docx)文件轉換爲HTML Lambda

有沒有辦法讓AWS Lambda上的Python腳本可以操作LibreOffice/OpenOffice的可移植版本?或者,是否有一個我省略的.doc文件的Python庫?

+0

您是否找到任何解決方案?如果是這樣,請分享您的經驗。我也想在Lambda中使用LibreOffice/OpenOffice的一些功能。基本上我想將.doc文件轉換爲.pdf。 –

回答

1

不幸的是,目前似乎沒有優雅的解決方案來解決這個問題。我試圖製作LibreOffice/OpenOffice的可移植版本,但最大的問題是尺寸超出了AWS Lambda的限制。

也許你想給Pandoc試試儘管它不能處理.doc文件。但是我成功在AWS Lambda上使用它。您可以訪問here瞭解如何爲AWS Lambda製作便攜版本。