2011-05-27 60 views
-1

嗨 正在開發一種小型搜索引擎類應用程序。它在Word文檔中搜索內容。我需要在gmail中實現一個「view as html」選項。當我點擊鏈接到文檔時,它應該在新瀏覽器中作爲html頁面打開。有什麼辦法可以做到這一點?在瀏覽器中以HTML格式查看MS Word

我能夠在iframe中打開word doc,但這不符合我的目的。

我的應用程序使用Asp.Net和C#。任何幫助,將不勝感激。

問候

維涅什

+1

看着Google Docs? – 2011-05-27 16:21:53

+0

看到這個,它可能會幫助你:http://stackoverflow.com/questions/3694090/saving-multiple-word-documents-as-html-through-office-api – contactmatt 2011-05-27 18:57:15

+0

@Tony:這可能是我的部署網絡可能無法訪問互聯網。我不確定我是否可以在沒有互聯網的情況下使用Google文檔。 – vikky114 2011-05-28 06:45:04

回答

0

使用方便,速度慢,內存密集型,不可擴展的,不可擴展(需兩次說)做這件事是使用Office COM API來加載文件的方式將它保存爲html(或者其他文本,因爲所有你想要做的都是搜索),但是我真的懷疑你可以在一個適度使用的網站上關閉它。

拋開這一點,您只剩下開源解析器或使用IFilter接口來完成它。我找到了後者的一個例子:http://www.neowin.net/forum/topic/316480-reading-text-from-ms-word-files-in-c

+0

我在搜索文檔中的文本時沒有問題。我使用Solr及其提取處理程序從word文檔中提取文本。現在我需要一種方式來顯示單詞文檔給搜索者,當他點擊鏈接時。我認爲把它顯示爲html會很好...... – vikky114 2011-05-27 16:40:39

+0

噢......好吧......在這種情況下,我沒有任何建議。這根本不是微不足道的。 – Blindy 2011-05-27 16:44:51