2011-10-03 49 views
3

Microsoft Word互操作性課程將讓您獲得a property called WordOpenXML。這表示一個包將被存儲 - 壓縮 - 在一個.docx文件中,並可以通過Microsoft Word打開。但是,有沒有辦法將這個Package轉換爲其他格式,特別是HTML?如何將System.IO.Packaging.Package轉換爲HTML?

我在an answer中讀到一個老問題,「Word 2007有一個可以用來轉換爲HTML的API。[...]你可以在API中找到文檔,但我記得有一個轉換爲API中的HTML函數「。我不是100%確定那傢伙在談論哪個API,但也許是System.IO.Packaging.Package或類似的東西。我似乎無法找到任何「轉換爲HTML功能」;有誰知道如何將Package格式的Word文檔轉換爲HTML?

回答

2

有問題的API可能是文檔上的Save方法;當選擇HTML文件類型時,Word會將文檔轉換爲HTML,並應用適當的樣式。

由於docx格式爲XML,因此可能會出現某種XSLT轉換;這只是推測,但它並不是什麼牽強的工作,因爲XSLT通常用於從XML創建HTML。

這就是說,你正在尋找的可能是而不是居住在Package class,也不應該。 Package類用於創建內容包,而不是轉換該內容。

但是,沒有任何東西阻止您提供該內容的轉換;您可以獲取作爲Word文檔基礎的XML,然後應用您自己的XSLT,從而生成您需要的HTML。