2013-03-12 108 views
1

這是我的問題:我的組織希望將用戶的Word文檔上傳到服務器。在服務器端,需要將文檔(用樣式強制執行)轉換爲XML格式文件。接下來,我需要使用php來解析打開的xml格式文件並將內容放入數據庫中。有誰知道如何在服務器端自動將單詞轉換爲XML?是否有任何API或示例代碼用於解析Open XML格式的PHP?您的建議表示讚賞。Word到XML轉換

+4

較新版本的Word(.docx)和OpenOffice的.odt格式已經*爲* XML。將其中的一個重命名爲.zip並查看 – 2013-03-12 13:25:31

+0

檢查此問題:http://stackoverflow.com/questions/5052292/php-read-and-write-in-ms-word – Anas 2013-03-12 13:28:47

+0

謝謝@Pekka웃我試過保存* .xml作爲選項,但它爲一個簡單的word文檔生成大量的xml代碼,其中包括該單詞的所有字體和其他屬性。 – nani1216 2013-03-12 14:00:07

回答

1

你看過使用VBA

我不得不做類似的工作,我在WSF或VBS文件中使用了VBA。如果您的服務器是Windows環境,它將從操作系統運行。您可以從PHP執行此操作(不推薦),也可以將Docx文件放到Web服務器環境以外的常用文件夾中。自Web服務器環境以來,我推薦後者。可以引入安全問題。

另一個需要注意的地方是,如果你想從樣式中分離內容,你需要對輸出標記進行一些後期處理。 Word是一個「字」處理器,所以它的設計就是它的樣式。如果這是一項要求,我會建議轉而使用基於XML的結構化創作工具。

希望這會有所幫助!