2015-11-04 111 views
1

我們收到的wordml文檔基本上是由msword文檔生成的XML文件,其中也包含所有格式化說明。現在我們有要求將這些文件轉換爲PDF。我看着iText xmlworker來做這個轉換。它所做的只是刪除了所有的XML標籤,並將所有內容作爲PDF中的單個段落提供給我,並且沒有格式化。WordML轉換爲PDF轉換

如何確保生成的PDF包含正確格式的文本從這個wordml文檔。

+0

你能夠從wordml文件中提取文本嗎? –

回答

0

iText的產品XMLWorker需要您手動處理每個XML元素(除非您有HTML作爲輸入)。 MS Word文檔的XML模式非常複雜,所以你需要花費幾年的時間才能獲得一些看起來甚至遠遠好的東西。簡而言之,XMLWorker不會做你認爲它的工作。

如果你想MS Word到PDF轉換,你需要另一種解決方案。 XDocReport(MIT許可證)就是其中之一,它具有iText 2(LGPL許可證)和iText 5(AGPL許可證)的插件。結果雖然不完美。