2011-08-17 85 views
5

我想加載一個網頁並使用命令行進行保存(希望獲得與保存頁面類似的行爲,就像在Firefox或Chrome中的完整頁面一樣。 )渲染一個html頁面並使用命令行保存它

我試過使用wget和httrack,他們給我正確的html文件。但是如果html格式不正確,瀏覽器會在渲染時使用它來修正它,如果使用save,那麼我們會得到正確的html,但在wget或htttrack的情況下不會發生這種情況。

是否有任何工具可以渲染頁面並將所有圖像和flash以及其他所有內容保存在本地。

+0

Firefox可以從命令行使用。但是我無法獲得保存頁面的選項。有任何想法嗎...? – 2011-08-18 06:43:54

回答

2

當我想要保存頁面以供離線使用時,我使用名爲「Scrapbook」的Firefox插件。那當然,不允許你的命令行要求。但是如果你使用像'htmlunit'之類的工具,你可以驅動Firefox瀏覽器進入你想保存的頁面。

1

你可以結合使用curl或wget的與tidyhtml,即

curl http://stackoverflow.com > page.html 
    tidy page.html > page_clean.html 

整潔應該能夠將任何無效的HTML標記到有效的XTML。

+0

不,即使這不幫助我.. – 2011-08-19 09:30:32

1

我找不到任何東西,所以最終結束了在Firefox中打開頁面,然後單擊另存爲按鈕並保存它。使用firefox和xdotools爲它自動完成了一個腳本。

感謝所有的幫助和意見的朋友。