2017-07-30 98 views
0

我使用的是textract python-pptx來提取文件的文本內容,效果很好。不幸的是,我們的客戶端也有需要處理的ppt文件,但我們在服務器中沒有任何MS Office/Open Office,因此我無法使用comtypes將ppt文件轉換爲其他文件類型,只需執行從那裏提取。Python 3.6從PPT文件中提取文本

非常感謝任何替代方法的建議。

我在Windows 64位機器上運行Python 3.6。

+0

我的建議是安裝OpenOffice/LibreOffice ... –

回答

0

在這裏轉換它們。 https://convertio.co/ppt-pptx/這將允許你在你的程序中使用它們。

+0

對不起,我忘了環境也無法連接到互聯網,因爲他們的數據包含高度敏感的信息 – mtryingtocode

+0

根據https://stackoverflow.com/a/24194435/ 7869371它看起來像最新版本可以讓你打開PPT文件。你試圖打開一個錯誤信息時會看到什麼? – James