2012-04-05 69 views
0

我想訪問Office 2003文件(.doc,.xls和.ppt)以便提取文本和一些元數據(文字數量,頁數,圖片,模板等) 。我可以使用Office XML文檔的Open XML SDK來完成此工作。但是,此提取程序將在服務器上進行,該服務器不能安裝Microsoft Office等應用程序(這就是我無法使用Office Interop的原因)。 我試過NPOI,但實際上它只支持.xls文件。我發現的其他庫不是開源的,我不能在我的工作中使用它...我下載了NPOI Scratchpad,但代碼非常「原始」,我無法在我的工作中使用它。 您是否有任何其他想法從Office 2003文檔中獲取文本和元數據?我不是一個非常有經驗的程序員,而我正在使用C#(但是,如果在C++中有這個問題的解決方案,我可以考慮使用它)。謝謝。訪問Office 2003文件

回答

1

有許多庫,例如:

  • ClosedXML(Office 2007中)
  • EPPlus(Office 2007中)
  • 的Aspose細胞(局97-2010,我用這一個)

我不知道任何免費的圖書館支持Office 2003格式。

祝你好運

相關問題