2017-03-08 154 views
0

我需要分析我的PHP應用程序中幾個PDF文件的註釋和書籤。 有沒有什麼方法可以提取這些信息?使用PHP從PDF中提取註釋和書籤等元數據

我只需要的是書籤名稱+層次結構和註釋內容+座標。

我寧願一個PHP庫,但我也可以在服務器上安裝其他軟件並用exec()調用它。

+0

你有幾個庫,在這裏可以做的伎倆:http://stackoverflow.com/questions/1004478/閱讀pdf文件與php – Kaddath

+0

ty,我試過PdfParser,但無法找出如何閱讀書籤。 – sboesch

回答

0

好吧,https://github.com/smalot/pdfparser似乎能夠提取書籤以及註釋。至少它提供了一個巨大的數組,包含所需的數據。

$parser = new \Smalot\PdfParser\Parser(); 
$pdf = $parser->parseFile('document.pdf'); 

print_r($pdf->getObjects()); 

所有我現在要做的是找出如何處理這個數組...