2008-09-05 61 views

回答

4

您可以使用Windows內置的IFilter接口從任何支持的文件類型中提取文本和屬性(作者,標題等)。這是一個COM接口,所以你可以使用.NET interop工具。

您還必須從Adobe下載免費的PDF IFilter驅動程序。

0

這裏是一個很好的列表: Open Source Libs for PDF/C#

大多數的這些都是爲了向創建PDF,但他們應該已經閱讀能力以及。

有這一個還有:iText

我只用iText的前播放。沒什麼大不了

0

添加到批准的答案:有交替的商業解決方案,以替代的Adobe IFilter的文本索引(提供類似的API,而且還要附加保費的功能):

  1. Foxit PDF IFilter:提供更快的文本索引比較Adobe的插件。
  2. PDFLib PDF iFilter:包含對受損PDF文檔的支持以及額外的API來運行您自己的查詢。

如果你正在尋找一個工具,可以從兩個託管的.NET應用程序和繼承的編程語言像傳統的ASP或VB6中使用,那麼這是在商業ByteScout PDF Extractor SDK將適合,因爲它同時提供了.NET和ActiveX/COM API。

聲明:我爲ByteScout工作