2010-08-16 331 views
1

我一直在尋找(失敗)的方式來打開PDF文件並從中獲取書籤。我已經查看了大多數PHP庫的PDF,但他們似乎專注於創作,而不是閱讀。如何使用PHP讀取PDF書籤?

在這一點上,我會很高興與任何語言的解決方案,所以它不是PHP,但它會很好。

謝謝!

+0

自發布以來,我碰到了pyPdf。它在閱讀pdf方面做得很好,但獲取命名目的地和輪廓的功能對我來說似乎沒有多大作用。 – 2010-08-16 19:18:00

+0

pdftk及其「dump_data」最適合我。從PHP使用exec()https://www.pdflabs.com/docs/pdftk-cli-examples/ – Teson 2016-08-09 09:42:20

回答

1

如果一切都失敗了,你可以嘗試解析PDF來提取書籤信息,儘管確切地說它在哪裏以及它看起來像什麼,我沒有模糊。在它的核心,PDF只是一個Postscript文件,一旦你過濾掉了所有的二進制垃圾(字體定義,圖像等等),你就得到了一堆純文本的Potscript代碼。

+0

這就是我已經辭職自己去做。我找到了包含書籤的文件的一部分,所以我只是試着將它們解析出來。謝謝! – 2010-08-17 12:54:09

1

你可能想通過PDFLib來看看在「的pCOS」庫:

http://www.pdflib.com/products/pcos/

它能夠從現有的PDF文件,包括書籤提取的各種信息,它是可作爲PHP擴展。這不是免費軟件,根據操作系統的不同,單臺服務器的價格爲245美元(195歐元)或更多。 (我與供應商沒有任何關係)。