2009-09-05 68 views
-4

在我的PHP腳本我想轉換爲PDF文件,HTML格式,雖然這樣生成的HTML文件的內容不應被打擾....PDF到HTML的轉換在PHP

我發現http://sourceforge.net/projects/pdftohtml/但是命令行工具,需要shell訪問。第二件事就是生成的html文件內容受到干擾..

+2

你已經問同樣的問題:http://stackoverflow.com/questions/1383176/pdf-to-html-conversion -in-php – AAA 2009-09-05 12:26:24

+0

如果你看起來超出標題,但不是完全相同的問題,但仍然很混亂。 – pavium 2009-09-05 12:27:59

+0

嘿傑米劉易斯,請再次閱讀這兩個問題,兩者都不同。 – 2009-09-10 06:53:31

回答

1

shell命令是否可以從php執行?

$rtn = exec ('CLI Command to execute', $emptyVartoCaptureOutput); 

命令在shell中執行,運行PHP腳本(_www或用於從Apache網絡服務器運行腳本類似)的用戶的環境下運行。當您提供第二個可選參數時,命令的所有輸出都會捕獲到數組中。

看起來像這樣可能會解決您的問題。

在回答您的評論:

你在原來的文章中引用的工具是命令行工具,你將執行 - 你需要找出確切的要執行的命令包括任何和該命令的所有參數。

我不熟悉你引用的工具,但我懷疑它有各種選項。有幾個重要的選項可以看到生成的html在哪裏。我猜想它可以轉到一個文件(這將需要_WWW具有寫入權限到一個具有巨大安全風險的目錄)或出來。當你使用php的exec命令時,當你將可選的第二個參數傳遞給exec函數時,任何發送到std out的輸出將被保存爲一個數組,一個新行的新元素。因此,您應該能夠從腳本中動態捕獲和操作和/或顯示輸出的html。

對於一個簡單的HTML頁面,只有從PDF顯示HTML,你可能會做這樣的事情:

<std header stuff omitted for brevity> 
<?php 
$rtn = exec('CLI Command to Execute -a option1 -b option2', $ouputted_html); 
foreach ($ouputted_html as $val){ 
    echo $val . "\n"; 
} 
?> 
</body> 
</html> 

你可以使用回聲破滅( 「\ n」,$ outputted_html);代替foreach循環來完成相同的功能,但是如果您選擇利用foreach循環,則可以對每行進行一些控制。

請注意,生成的html可能包含或不包含標題信息,您將不得不嘗試並查看。顯然你可以添加一個標準的HTML頁面需要或減去,如果已經提供。

因此,您現在有基礎將PDF文件顯示爲html,如果您需要與該工具的複雜性有關的特定幫助,我建議您尋找專用於該工具的論壇或listserv,或者可能需要開發人員的幫助(s)閱讀文檔和常見問題後。

+0

斯科特,可以建議任何命令行應用程序..在此先感謝 – 2009-09-10 06:54:56

+0

你可能會考慮投票答案,即使他們沒有完全回答你的問題,你也會發現有幫助。 我會編輯我的原始答案以迴應您的評論。 – Scott 2009-09-12 18:41:20

+0

+1好回答 – jycr753 2014-01-29 13:08:25

0

最好的辦法可能是找到一個開源的PDF轉換器,並研究源代碼。

有很多在線轉換器,大概是。谷歌提供轉換髮現在搜索任何PDF文件並調用它的視圖作爲HTML「