2012-01-27 130 views
0

可能重複:
How do I grab a thumbnail screenshot of many websites?機械化打印到PDF

我用perl機械化登錄並獲取一個網頁寫了一個腳本。如何直接從我的Perl腳本「打印」該頁面爲「pdf」?我想保存它在瀏覽器中的外觀快照。

我可以用$mech->content();

+0

請參閱我的回答[有關爲文本中的每個單詞創建圖像的建議](http://stackoverflow.com/a/7820994/46395)。 PDF輸出支持,它將是一個*真實* PDF與可選文本和東西,而不僅僅是一個巨大的嵌入式位圖截圖。這個模塊還沒有一個機械化兼容的前端,但編寫一個不會太困難,因爲[之前的版本有一個](http://p3rl.org/Gtk2::WebKit::Mechanize )。 – daxim 2012-01-27 10:50:33

回答

2

檢出wkhtmltopdf - 有PDF和圖像(PNG等)的變種。它基本上是一個包裝webkit html引擎的命令行工具。工作得非常好,而且它也是跨平臺的。您是否可以通過登錄表單獲取它將取決於目標網站的工作方式。

+0

這不與Mechanize整合。 – daxim 2012-01-27 10:52:30

+0

@daxim「整合」是什麼意思?您從Mechanize中獲取HTML,然後將其提供給wkhtmltopdf。 – Schwern 2012-01-27 10:56:03