我目前正在使用Perl腳本,並使用CPAN模塊WWW:通過機械化從網站獲取HTML頁面。 但是,我希望能夠在離線HTML文件上工作(我會事先保存好自己),所以每次嘗試新腳本時都不需要互聯網。 所以基本上我的問題是如何改變這樣的:使用perl WWW ::對本地文件進行機械化
$mech->get('http://www.websiteadress.html');
到這一點:
$mech->get('C:\User\myfile.html');
我見過的文件://可能是有用的,但我顯然不知道如何使用它,因爲我每次都會遇到錯誤。
您確定要使用'上的本地文件WWW :: Mechanize'?當你只需打開文件時,使用'LWP'套件就沒什麼意義了,模塊的許多用途是處理對鏈接的點擊,表單填寫和提交以及在瀏覽器上模擬後退和前進按鈕。這些都不是靜態文件可能的,所以你只剩下頁面的分析,你只需要[HTML :: TreeBuilder](https://metacpan.org/pod/HTML::TreeBuilder) WWW :: Mechanize'子類。 – Borodin
正如我所說的腳本的目的是在網頁上工作,本地文件只是一個替代方案,主要是爲了測試編碼錯誤(我真的想知道爲什麼它不起作用!)。感謝您指出另一種方式來做到這一點。 – Azaghal