2010-03-08 96 views

回答

3

谷歌pdf2html,pdftohtml看起來是唯一可行的。它基於一個命令行程序,而不是PHP。所以它可能對你沒有用處。谷歌有能力進行轉換,所以也可以通過GDocs來實現。儘管我不確定這一點。無論如何,我希望這至少能讓你走上正確的道路。

+0

我不知道PHP,但大概你可以執行/從PHP內部調用shell腳本(並捕獲輸出),所以這可能會工作 – 2010-03-08 17:12:29

+0

絕對可以做到這一點,這就是爲什麼我把它提出來,我不確定谷歌會讓他輕鬆做他想做的事情。 – 2010-03-08 20:41:39

+0

優秀的解決方案,謝謝! – 2010-03-10 11:17:49

0

你不能。

PDF是包含嵌入字體,矢量圖形和佈局信息的複雜文檔,無法用HTML自動錶示。您可能能夠提取文檔的TEXT,但這就是它。

1

我試過Poppler的pdftohtml命令將PDF文件轉換爲HTML文件。 Check it out on Poppler的HTML文件輸出在使用時較亮,但輸出不太準確。

如果你想準確輸出你應該use pdf2htmlEX我已經轉換複雜的PDF文件,並得到最好的HTML輸出。