0
我使用Xpdf提取PDF文件與-raw
方法適用文字,但現在我們要的PDF文件,HTML文件轉換爲提取HTML格式化標籤,如大膽<b>,斜體<我>等與文本。 Xpdf與選項確實工作,我也嘗試使用pdf2html這個,但沒有找到它可靠的標籤,如<sup>和<sub>在哪裏丟失。有沒有辦法在Perl中使用Acrobat Reader將多個PDF文件保存爲HTML文件?
我們現在使用Acrobat Reader將PDF文件保存爲HTML文件,該文件爲我們提供了所有HTML格式標籤。
有沒有辦法在Perl中使用Acrobat Reader將多個PDF文件保存爲HTML文件?
謝謝。
你真的需要從Perl做到這一點,或者任何可以控制外部應用程序的東西嗎? – 2009-07-27 18:28:35