0
我需要分析我的PHP應用程序中幾個PDF文件的註釋和書籤。 有沒有什麼方法可以提取這些信息?使用PHP從PDF中提取註釋和書籤等元數據
我只需要的是書籤名稱+層次結構和註釋內容+座標。
我寧願一個PHP庫,但我也可以在服務器上安裝其他軟件並用exec()調用它。
我需要分析我的PHP應用程序中幾個PDF文件的註釋和書籤。 有沒有什麼方法可以提取這些信息?使用PHP從PDF中提取註釋和書籤等元數據
我只需要的是書籤名稱+層次結構和註釋內容+座標。
我寧願一個PHP庫,但我也可以在服務器上安裝其他軟件並用exec()調用它。
好吧,https://github.com/smalot/pdfparser似乎能夠提取書籤以及註釋。至少它提供了一個巨大的數組,包含所需的數據。
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
print_r($pdf->getObjects());
所有我現在要做的是找出如何處理這個數組...
你有幾個庫,在這裏可以做的伎倆:http://stackoverflow.com/questions/1004478/閱讀pdf文件與php – Kaddath
ty,我試過PdfParser,但無法找出如何閱讀書籤。 – sboesch