2009-07-28 97 views
0

是否有可用於讀取PDF文檔並將數據轉換或導出到Excel文檔的示例代碼或實用程序?從PDF中提取數據並導入到Excel .NET

我在搜索時看到的大多數示例代碼都將Excel轉換爲PDF。

+0

免費下載我發現了一些pdfbox的實用工具,我使用dll從pdf文件中提取文本。 – Batuta 2009-07-30 02:26:39

回答

1

問題是,PDF可能不會保留任何電子表格類型結構 - 它只是在頁面上繪製的文本。所以你不可能對結果滿意,除非它是一個非常簡單的頁面。

0

您唯一真正的選擇是尋找第三方解決方案。我懷疑你會找到一個免費的SDK,它可以讓你做到這一點,原因很簡單,這並不容易。我會檢查出Solid Documents和可能的一些Investintech's solutions

較新版本的Acrobat還提供了一些更高級的PDF到Excel提取功能,因此Adobe's PDF Library SDK也值得一看。

1

您可以用pdfsharp提取數據並使用openxml sdk創建一個excel文件。這樣你就能得到你想要的東西。這將需要一些工作,但不需要Excel或Acrobat或任何花費金錢。

優點:

  • 免費
  • 沒有Excel對象模型
  • 只使用庫
  • 你得到你想要什麼

缺點:

  • 需要花費時間對代碼進行編碼
1

我創建了一個解決方案,它使用開源XPDF和VBA的組合將多個PDF文件的數據以結構化格式導入到Excel中。它通過指定開始和結束文本模式並使用可選替換提取文本以清理輸出來工作。該解決方案可以從http://www.business-spreadsheets.com/forum.asp?t=884