2010-10-19 120 views
8

是否有.Net開放源代碼庫將word dococument轉換爲HTML以在網頁內顯示。將Word文檔文本轉換爲HTML的庫

我知道幾個工具來將word文檔轉換爲html文件,但我的要求是將文檔(無論是從文件還是僅提取文本)轉換爲ASP.Net應用程序中的HTML。

我發現converting-a-word-document-into-usable-html-in-php PHP庫做同樣的事情,是否有.net中的任何類似的工具?

+1

爲什麼不轉換爲文件然後閱讀HTML文件? – 2010-10-19 18:34:55

+1

如果沒有辦法,那麼這是最後的選擇,目前我們將doc存儲爲db中的blob,因此將其轉換爲HTML字符串比將文件系統存儲爲doc作爲doc並啓動word interop以將其另存爲html和然後從應用程序讀取... – RameshVel 2010-10-20 04:38:26

回答

2

你只是想將* .doc文件轉換爲HTML?將它保存爲一個HTML文件的選項?

有標準.SaveAs方法,具有保存爲HTML的選項:

wdFormatHTML保存所有的文本和HTML標記格式,這樣所產生的文件可以在Web瀏覽器中查看。

來自:MSDN SaveAs Method

如何使用的方法爲.doc轉換成不同的格式,你可以在這裏找到一個實例教程:How to convert DOC into other formats using C#

如果你有* .docx文件而不是* .doc文件,它會更容易,因爲你可以使用OpenXML API,如MSDN在這裏所述:Manipulating Word 2007 Files with the Open XML Format API (Part 1 of 3)。如果你得到Word文件的XML,你當然可以將它輸出爲任何你想要的格式(HTML)。

+0

是的,我知道這個解決方案.. – RameshVel 2010-11-02 12:21:35

+0

好。它回答你的問題還是我錯過了什麼? – 2010-11-02 12:25:28