2010-08-11 173 views
0

我使用PDFBox從PDF文件中提取大綱(書籤)信息,甚至在同一個站點中解釋這些信息。使用Java從PDF文件中提取大綱(或書籤)

但是,我有問題沒有解壓,但生成合格的網址(foo.pdf#page=22777&zoom=2,2,777)打開這些書籤中的PDF。有時PDFBox無法找到放置書籤的頁面(即頁碼,左側座標或頂部座標是錯誤的)。

任何人都知道一個能夠做到這一點的PDF庫(最好在Java中)?謝謝。

此致敬禮,

亞歷山大。

回答

1

iText(http://itextpdf.com)可能適合你。

我主要用它來創建PDF文件(與解析已經存在的文件不太一樣),但是這個庫很好,並且有與輪廓和書籤相關的對象。

+0

是的iText的工作就像一個魅力,我正在使用它正確提取頁面!他們甚至在他們的工具箱中提供了一個例子(http://bit.ly/cvf5iT)。 – Alexander 2010-08-12 11:32:58

+0

太棒了。很高興能夠幫助。 – MikeTheReader 2010-08-12 14:13:51