我有一段代碼用於閱讀MS Office Word文檔。試圖閱讀MS Office文檔
static void ReadMSOfficeWordFile(string file) {
try {
Microsoft.Office.Interop.Word.Application msWordApp = new Microsoft.Office.Interop.Word.Application();
object nullobj = System.Reflection.Missing.Value;
object ofalse = false;
object ofile = file;
Microsoft.Office.Interop.Word.Document doc = msWordApp.Documents.Open(
ref ofile, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj);
string result = doc.Content.Text.Trim();
doc.Close(ref ofalse, ref nullobj, ref nullobj);
msWordApp.Quit();
CheckLineMatch(file, result);
}
catch {
RaiseError("Unable to parse file because of MS Office error.", file);
}
}
我對此有三個問題。
首先 - 它依賴MS Office安裝在每個可能運行的系統上。有些人更喜歡Libre Office,但這仍然需要針對MS Office Word文檔運行。
二線,我不知道這是否會甚至對MS Office 2003和MS Office 2007和文檔工作...
第三 - 這是緩慢的。這是非常慢的。
SO!我認爲必須有比這更好的方式來運行它。我猜測有人必須知道比新手更好的方式。我只是試圖閱讀文檔中的文本,沒有別的。
謝謝!這確實修復了這一部分。 – MTeck 2012-03-12 18:19:59
相反,我們可以使用NPOI,這是開源項目。查看我的文章,瞭解如何使用NPOI從.DOC文件中讀取所有文本的示例 – Riju 2012-05-11 07:31:26